07/03/2011

Episodic Memory – Key to Thinking

- autor: Wieslaw Galus

Eutherm Ltd, Poznanska 129/133,
Ozarow Mazowiecki, 05-850 Poland
w.galus@eutherm.eu

Preprint of an article submitted for consideration in International Journal of Machine Consciousness © 2011   copyright World Scientific Publishing Company http://www.worldscinet.com/ijmc/ijmc.shtml

Received Day Month Year
Revised Day Month Year

wersja polska:

http://mindconsciousness.wordpress.com/2011/03/06/pamiec-epizodyczna-%E2%80%93-klucz-do-myslenia/

Abstract

Intelligent machines should be equipped with motivation to broaden their knowledge via their own experiences and to infer on basis of previous experiences. Thus, they should possess self-consciousness that would allow them to express higher mental functions such as reasoning, curiosity, understanding, stubbornness, bravery, etc. This paper presents a flowchart schematic for an artificial brain that would aspire to realize the higher mental functions that are present in the human brain. Also presented is the significance of episodic and association memory plus their interrelations with the inclusion of short-term memory, working memory, associative memory and long-term memory. A structure for the episodic memory is presented alongside its place in the architecture of emergent connectionist network. The paper also shows the inaccessibility and uniqueness of the internal language of neural correlates of mental events and difficulties in creating hybrid architectures.

 

Keywords: self-consciousness; cognitive architectures; curiosity; machine reasoning; understanding; ; episodic memory, schematic of artificial brain, mind

1.   Introduction

An artificial cognitive neural network should realize mental functions similar to those of a natural mind. In specificity, the cognitive networks should be characterized by a rich repertoire of behaviours and thought processes typical for animals or humans. Cognitive networks that aspire to achieve self-consciousness are characterized by motivation – understood as the necessity to understand the reality – as well as by curiosity, imitated by proper mechanisms of environment and memory exploration, as described in Machine Mind [Galus 2011]. This should, however, not be taken as a statement that any artificial network can possess a psyche that is comparable, or beyond, that of a human being.

We need to start the analysis by focusing on the ways in which the mind registers stimuli from the senses. In the quoted work was presented a recognition and categorization method for visual stimuli. The proposed schematic was described and acknowledged by many researchers and appears sufficient for analysis of the issues of motivation and the mechanism that activate the memory in order for the mind to carry out cognitive functions. However, when faced with the activity of a individual specimen we come across the problem of recognizing and registering an actively changing environment. Applying that to visual observation of environment, we see static images that change in a dynamic fashion, episodes composed of series of images that resemble film clips. The higher fields of the network, responsible for creation of qualia, are therefore not excited by a stable configuration of neurons but rather by rapid changes of these configurations occurring within the input nodes, where the dynamic of the changes themselves depends on the rate of the input sensations.

We know, that both, human beings and animals, possess ability to remember the observed episodes in a storage area called the episodic memory. This is an important location on most flowcharts presenting the mind’s operations. However all models for episodic memory, employed until today, have been far removed from the actual operating principles of the episodic memory in the animal brain. Although the importance of episodic memory function in the cognitive processes is well recognized, the actual mechanism of storing the episodes has not been researched sufficiently. This paper presents a hypothesis of how such processes may be realized; how to complement the architecture of artificial neural networks, allowing them to register and recall the required episodes; and what would be the consequences of such model for the psyche of neural networks organized accordingly.

2.    Requirements for the cognitive network

It seems obvious that in order to achieve higher mental functions similar to those occurring in the human brain, the network should be connectionist with an emergent architecture [Duch, 2010]. It should meet the requirements set forth in the Machine Mind [Galus, 2011]. A special characteristic of such a network is its multilevel, hierarchical structure, high capacity memory and feedback loops that allow excitation of the descending hierarchy of the neural cell fields. Apart the fields and layers that constitute the hierarchic structure, specialist areas should also be designed – responsible for the functions of: speech, emotions, reasoning, logic, geometric and mathematical transformations, timekeeping and planning as well as motor fields, controlling the body, speech apparatus and sensors. A neural network modified by synaptic reinforcement seems quite inadequate when faced with the need to record a quick, massed, great inflow of data that needs to be stored in the episodic memory. The neuron cells should be accompanied by memory cells capable of permanent change of state under the influence of a singular electro-chemical stimulus provided by the network. Such role could perhaps be realized by astrocytes that are believed to serve an important function in the information processing taking place in the brains of humans and animals. In any case, the nodes of an artificial network should consist of cells capable of introducing permanent changes in the transmission parameters of the network. Sampled temporal segments of each episode, much like movie frames, must be registered in subsequent memory cells. If we remember that each percept and scene is accompanied by a significant tree of cell group excitation that ascends to the higher layers of the processing hierarchy, we come to conclusion that registering subsequent configurations of excitations of these cells will result in the memory being flooded by a giant torrent of unnecessary information. The way in which images are constructed in a hierarchic, connectionist network results in a remarkable ability to compress the information recorded. As the processing pathway passes through fields and groups of cells that are specialized in recognizing singular aspects of the analyzed image, in the subsequent configurations of excitations responding for the sequence of time segments, the only elements to be registered will only be these cells that recognize the changing aspects. The remaining configuration sets, associated with the observed scene will remain unchanged, and when the episode would be recalled, they would create a complete and dynamically changing rerun of the episode in cooperation with cells responsible for registering changes.

All information reach the Central Executive (CE) – the highest field in the semi-hierarchical structure of information processing. In many of the available works the CE is tasked with the role of situation analysis i.e. thinking, associating abstract notions, planning, motivation and goal setting, concentration and control over the effects of undertaken actions [Baddeley 2000, Starzyk & Prasad D.K. 2011, Nuxoll & Laird, 2007, Edelman 1992]. Such wide range of tasks that CE is forced to fulfill, results, that no specific structure was singled out that would effectively realise all these functions. In the works referenced above as well as in other attempts to propose working cognitive architectures, the consciousness functions have been moved to this central field without providing information on how exactly are they to be realized or stating that it impossible to achieve such functions at the current state of the art of technology.

A paper by Starzyk from the University of Ohio [Starzyk 2011], analyzes the mechanisms for concentration of attention and describes systems for effectors and location control. An attention switching mechanism located in the CE, based on competition of excitation configurations by stimuli reaching the association memory, being a part of the CE, would select the winning mental representations on the winner-takes-all (WTA) basis, creating in effect, a stream of consciousness. The episodic memory serving as a basis for the learning processes, would be filled with such pre-selected data provided by the semantic memory. The “Planning and thinking” block would be responsible for planning and thinking, triggering conscious attention focusing, recalling of episodes, controlling effectors and would cooperate with the block responsible for goal definition and motivation. While we can imagine a stream of conscious registration of stimuli that reach the level of comparison and selection, still unknown is the actual aim and way of recalling required episodes by the consciousness that has to be already emerged before it may serve its selective and regulatory functions.

3.     Schematic of a brain-type neural network

Armed with the hypothesis regarding the operating principles of the episodic memory and taking into consideration the need to understand the mechanisms of curiosity as described in Machine Mind [Galus, 2011] we can attempt to propose a certain network architecture that would realize functions of the human brain, demonstrating self-consciousness and other complex mental states. A schematic for such a network is presented on Illustration 1.

Schemat mózgu kolor

Fig. 1. The ascending signals are shown as solid lines, descending signals as dashed lines (the schematic shows only the primary excitation pathways between the operative blocks). The Center lines show repetitions of blocks in vertical direction (to determine the level of processing), and in horizontal direction (for denotation of sensory modalities). The separate sensory blocks that constitute levels of processing A1, … A4, … Ak correspond to fields V1, … V4, … Vk in the human brain. The brain interacts with its environment via sensors and effectors. The Body, Internal Parameters block is a collection of sensors that analyze the physical state of the network or agent body in the case of embodied intelligence. The internal structure of blocks is presented on Illustration 2.

The most important part of the presented schematic is the network of connections between the separate areas of the “brain.” An especially important and, sadly, neglected element is the network of backward, descending connections which are responsible for the curiosity mechanism. It should be remembered, however, that the connections presented, show only a chosen set of excitation transmission and that they represent clusters of neural connectors that sometimes consist of millions of neural strands that connect individual processing fields, which allow groups of cells – network nodes – to transmit the excitation states.

Individual areas constitute a semi-hierarchic structure only in functional terms. They could be incorporated into a uniform network structure with similar characteristics. In specificity, the CE area does not have to constitute a uniform whole. It could be divided between other areas of higher mental functions – uniting their actions. The actual localization may be dependent on the requirement to minimize the length of connections and their optimal cooperation.

The division of areas into layers is in itself symbolic. The sensory and perceptive fields have a classic neural network form as they serve cognitive functions. Their multilayer structure is required in order to allow cell groups to realize functions that in the human brain are realized by a singular neuron or a group of a few neurons. The long-term memory cells are not differentiated as a separate layer in artificial neural networks but rather accompany the association and short-term episodic memory cells. Perhaps they should serve a function similar to the function of astrocytes in the animal brains. The association memory cells realize a comparative function, i.e. they calculate the correlations of excitation configurations that arrive to these cells from the lower levels.

A fragment of a cognitive neural network corresponding to a specialized block is presented on Illustration 2.

Fig.2 Episodic Memory

Fig. 2. Creation of episodic memory in typical memory; time sequences are changed into spatial arrangement.

Excitation at moments t1, t2 ….tn are registered in cells c1, c2,… cn located in the vicinity. They are registered in a sequential order, when a cell of a lower number has changed its state by registering the previous excitation. Strong or recurring stimuli are recorded by the long-term memory cells lm1,… lmn that correspond to association memory cells. Excitations are filtered through the association memory and transmitted out of the block to connected structures in a way presented on Illustration1.

Separate layers on Illustration 2, designated with numbers 1,2,3,4 represent specialized layers that connect “neuron” cells – nodes that serve specific functions. Looking at the functions served by the cell groups in their respective layers, we can differentiate them into:

1 – Input Layers (IL)

2 – Short-term Memory (SM) and Short-term Episodic Memory (SEM)

3 – Association Memory (AM)

4 – Long-term Memory (LM) and Long-term Episodic Memory (LEM)

Short-term episodic memory cells, presented on Illustration 2 as “n”, Long-term Episodic Memory, presented as ln , and Association Memory cells Cn are separate neuron cells localized in artificial cerebral cortex in accordance with the localness hypothesis. They are connected in such a way that an excitation can be forwarded to subsequent, neighbouring cells. The excitation propagates automatically to further long-term and short-term episodic memory cells which results in “displaying” of the recorded sequence. However, for this to occur, the episodes need to be properly registered beforehand in these memories. This takes place thanks to specific operating principles of the association memory cells. Therefore, a hypothesis is proposed that in order to achieve the required effect, the operation of the cell groups must be as follows:

  1. Stimuli received by the receptors form object patterns that are recognized in the input layer (layer no 1) that creates a cognitive neural network.
  2. At the highest level of the network, that we shall call operational short-term memory, the recognized patterns responding to subsequent time segments for a given tn moment are recorded. The set of neural cells being a neuron correlate of these changing patterns will undergo changes so it will be different in any time moment tn.
    As in a short time period most elements of a scene do not change significantly, the majority of neural cells will remain in their previous state. The changes will affect only the part of cells responsible for recording of the changing elements of the scene. Illustration 2 shows these cell groups as squares denoted tn in the SEM layer (layer 2), their designation matches their corresponding time moments.
  3. All stimuli configurations from the SEM layer should be transferred to the next cell layer characterized by its further specialization. Their operating principle is that if subsequent signals do not change for a longer time, their corresponding excitation pattern is recorded in the long-term memory in the LM layer. Regardless from this process the signal is forwarded from these cells to other areas (blocks) that are placed higher in the processing hierarchy. However, if there is no correlation between the excitation patterns (which means there are changes in the excitation configurations), the new configuration is recorded in new memory cells designated as Cn. Due to their ability to recognize the level of pattern correlation and the ability to forward them on the basis of existence or lack of existence of such correlation, these cells are called Association Memory (AM, layer 3). If the state of neural excitation in AM is maintained for a longer period, no matter the reason, it must be recorded in LM. If a group of neighbouring cells lm records a sequence of subsequent configurations corresponding to a changing scene in a series of time moments, such memory will be called the Long-term Episodic Memory (LEM, layer 4).

A group of cells created on the basis of the above operating principles may realize a pattern-recognition and recording function. Based on the method of correlation recognition, the patterns may be recorded in long-term memory or be transferred to higher fields in the processing hierarchy. It should be noted that in the proposed model the episodic memory cells tn do not stand out from other short-term memory cells and in a similar manner the episodic memory cells do not stand out from other long-term memory cells ln. In this model the episodic memory is created using long-term memory cells typical for a given structure. Moreover, it should be noted that such a network changes the temporal sequences into spatial sequences, recording data from a series of subsequent moments in neighbouring memory cells. The recalling of a sequence transforms the spatial distribution into a sequence of scenes that are played out. Similar method may be utilized for recording mental processes dealing with logical, abstract or mathematical thinking that would constitute specific types of mental episodes. Such recorded information could be accessed by the system, at will, much like episodes from its? individual history.

Processing areas consist of similar blocks – arrangements of cells that in their entirety resemble a cerebral cortex. Just as the CE block, localized among other specialized blocks of an artificial mind, described above, the remaining blocks can, hypothetically, constitute a single layer of cerebral cortex divided into specialized areas. The semi-hierarchical structure presented on Illustration 1 consists of only a system of connections plus the order of transmissions between different blocks. Apart the actual order of transmitting the ascending signals, these areas are differentiated by their joining to sensory organs that deal with both the environment and the state of the body/network itself. This way, the fields that are joined to sensors create sensory fields with their topographic and retinotopic maps. Depending on the type of sensory input defined by the sensors connected there is a range of modalities of sensory inputs (Sensory Input block). Part of the artificial cerebral cortex that is connected to the effectors should, therefore, serve as a basic motor cortex (Motors, Effectors, Actuators block). A specialized part responsible for effectors would be in charge of the speech apparatus and the orientation and tuning of sensory receptors. If the artificial brain is provided with a full body, it should be conscious of the state of its body. This would provide possibility to use well established motivation systems such like the drive to minimize “pain”. If embodied intelligence would be able to take into consideration many parameters defining state of its “body” it should be possible to create a hierarchy of pain, establishing an excitation scale related to the severity of danger signalized by the pain. However, the dominating motivator would not be the physical pain. Pain signals should be transferred to the Central Executive, where they would be compared with other signals and, after being “understood”, a decision would be made on the strategy of avoiding that pain.

Feedbacks covering the fields of emotion (Mental Pain & Emotions), body (Body & Pain) and motor (Motors, Effectors & Actuators) functions would be responsible only for quick reactions to sudden dangers, as a form of a survival instinct, without actually engaging the consciousness. The cognitive functions would be realized mostly at individual layers of sensory data processing areas.

The long-term memory of the system is dispersed and localized both in the CE block, as far as past episodes are concerned, in the Speech & Language block, as far as semantics and syntax is concerned, plus in other specialized blocks in regards to logic, reasoning, geometric and mathematical transformations. The episodic memory of the lower processing fields corresponding to brain fields V1… V4 and higher ones, consists of components of episodic sensations that are utilized when episodes from higher fields are recalled. The long-term memory ensures the permanency of recognized data transfer pathways in layer 2 and permanency of selected data transfer when in accordance with the expected pattern by the association memory in layer 3 to higher layers of processing. The pattern becomes permanent when:

  1. the stimuli and excitation are very strong. The excitation may result from sensory signals from the sensor fields as well as from internal sources –signals from other processing fields.
  2. the stimuli are frequent. The repetitions may result from frequent sensory signals or from return signals from higher processing layers – from cells that lay on the pathway for excitation pattern transfer to CE.
  3. There is a synchronisation of stimuli with signals transmitted intentionally or non-intentionally from the higher layers, which conditions recording in long-term memory which in turn provides additional reinforcement for a given stimuli while limiting other stimuli that fight for the system’s attention i.e. being forwarded to higher processing layers.

There should be a possibility for the ascending path recording process should be complemented by formation of a parallel descending pathway. Long-term memory cells can be fitted with such a function, although there is no research indicating that such a correlation is present in case of animal brains. Discovering relation between the realization of association functions and the long-term memory is of vital importance for neurological research. Much promise is associated with the role of astrocytes in these processes.

Consciousness is emergent within the Central Executive block. The Self & Understanding block is responsible only for registering the state of understanding and self-consciousness that are, in fact, located in CE block. In a similar manner, all the higher mental functions may be recognized in the association memory of the CE block and recorded as “experienced” in the cerebral cortex block named “Self.” The abovementioned intentional signals that coordinate long-term memory activation are governed by a conscious mechanism of “attention.” When analyzed from the viewpoint of selection of different configurations of mental states, this means that the correlated CE cells send strong return, descending, signals to lower fields, generating a strong excitation that is chosen by the selection and transfer by WTA mechanisms back to the higher levels. The correlation between proper CE cells and groups responsible for configuration recording in the lower fields are created in the process of learning and experience collecting which in turn results in connections (pathways) recorded in the long-term memory. The same signals when send spontaneously due to excitation that is not associated with conscious states, would mean a mechanism for unconscious “attention switching.”

4.     Episodic memory – operation

The episodic memory allows for recording sequences of events (scenes) or sequences of states. For that purpose, the brain has to divide a given event into shorter time segments and record them in subsequent cells corresponding to the temporal sequence based on the timeframes of these segments. Some of research seems to indicate that the subsequent cells are in fact neighbouring cells, which would be in accordance with the localness hypothesis, presented in the Machine Mind paper [Galus 2011]. In most cases, scenes are differentiated only by sparse changes in their constituting images. The scenes are recorded in neighbouring, subsequent cells. Therefore, these cells have to be joined by a serial connection so that excitation of one of them results in activating of a whole series of subsequent cells. This results in capability to access whole episodes at will, and replaying them in their entirety. There is also possibility of initiating the recall from a chosen scene in the recorded episode – a scene that is most crucial for the aspect that is being analyzed at the conscious level. After such excitation, the subsequent, serial cells would be activated in a configuration corresponding to recorded episodes, forcing intentional or coincidental “remembering” of past sensations. The exciting signals from other blocks would not have to reach the working memory but could excite recall of configuration episodes directly from the long-term memory.

With such assumptions question arises concerning the faithfulness of recording and recalling of a stored episode. This concern both the temporal resolution, connected to sampling frequency, as well as spatial resolution, or to be more general – sensory resolution. To register visual sensation the sampling time for individual episodes must be short enough to create a feeling of continuity of the image. On the other hand its speed cannot be shorter than the time needed to process the image in its dynamically changing aspects. Most research data on this issue is based on research of the human brain. It seems that in case of humans the sampling time is equal to registration from few to a few dozen frames per second. Shorter sampling time is required for the sense of hearing and is connected with the ability to differentiate frequently recurring sounds. These times equal the frequency of a few hundred Hertz. Other senses do not require such great sampling frequencies.

The spatial resolution of the recalled images is remarkably variable. We know that when reminiscing of a landscape we at first see a general shapes, colours and dominating objects. We also direct our attention to dynamically changing elements. This means that CE is reached by signals from the association memory. Taking a well known landscape as an example, we can assume that CE will consciously recognize the beach, water and sun over the waves. Plus a flying seagull. These sensations will be generated in a sequence, as a result of two variables that force changing patterns of stimuli to be transferred to CE. The first variable is discharge the sequence of short-term episodic memory cells. The waves of changing excitations will be recognized as the movement of the seagull over the horizon. The second variable is the switching mechanism of attention, that focuses on the main elements of the landscape, allowing us to see, in turn, sand, water, horizon and sun. This mechanism is described in a paper [Starzyk at all 2011] is in accordance to the postulated competition of excitations [Baddeley 2000]. The order in which the elements are perceived could be regulated by the mechanism of mental saccades that was also analyzed in the previously mentioned work [Starzyk 2011] and that resembles the saccadic eye movements.

If we focus our attention on the details (which means that the competition mechanisms select new objects of attention, focusing on them), we will be able to perceive smaller details, like: the breaking of waves, footprints in the sand or the movement of the seagull’s wings. What mechanism allows for such a change in resolution of the recalled episode? This is possible due to excitation of the deeper memory structures in fields responsible for recognizing scene details. Therefore, we can expect, in relation to the natural brain, a system of return, descending connections, from the higher processing levels to the lower, closer to perception fields. A similar system should be included in designs of artificial systems. This type of backward, descending connections was described earlier [2] and is connected to creation of patterns for comparison within the “curiosity” mechanism. This name was chosen because this mechanism is responsible for penetrating and exploring of the memory, i.e. realizing cognitive functions that allow introspection, reflection and, through association, understanding of new phenomena arriving from the sensory fields. This excitation of episodic memory may be conscious, as the excitation signals that trigger recalling of episodes originate in the highest layer of CE in association with other notions, possibly originating in other areas. This could be an area responsible for processing other modal functions, e.g. the hearing and speech recognition block, which is responsible for the fact that when we hear the words “beautiful summer vacation” certain semantic memory structures are excited and the excitation signal is forwarded through internal vertical and later descending connections to the episodic memory. Similar mechanism can invoke even more detailed elements in images from the episodes recorded in our memory, which we can call sub-episodes. However, we cannot be certain whether given sub-episodes are in fact elements of the episode that evoked them. This is because there is a possibility of exciting sub-episodes from a completely different ”fable” as long as they seem to match our memories and as long as our CE accepts and “recognizes” the final, artificial episode. If our memory has a sub-episode consisting of the sound of seagulls’ cries, it can be used as a sub-episode in different episodic recollections.

Sub-episodes can be excited by descending connections, visible on Illustration 1 and denoted by letters Ak , Bk , Ck where ABC stands for sensory modality and the k index is the level of pattern analysis. This pattern can be correlated with the level of detail of a given scene. This is when an interesting question arises: how to choose the k level? Two hypothetical possibilities need to be addressed. The first assumes that we excite all the hierarchy levels simultaneously. In this case the consciousness is provided with a level of detail chosen by the pattern selection of the competition mechanism (equal to attention switching mechanism presented in [Starzyk, 2011]). The second possibility is choosing the k level by binding the k descendent pathway to its corresponding ascending pathway, as it was described above. Such connection must be recorded in the long-term memory and can be created via learning processes, i.e. recording of events. It is possible that both possibilities are at work in the animal brain. The current understanding of neural processes and the role of astrocytes in these processes does not allow us to infallibly determine the ways in which association and long-term memory cooperate and what is their exact relation to the episodic memory.

We can see that the described operation of recalling episodes with varying level of detail creates different needs for working memory in which it happens. The brain can be said to protect itself from overload. Episodes that we seldom recall are eventually forgotten (except their elements that are frequently used as sub-episodes) and usually, after some time, we remember only static scenes that are animated only by imagination or verbal narration. If these memories are not used, they also eventually disappear.

The mechanism for forgetting episodes is as important as the mechanism for their recalling. The short-term episodic memory of the sensor areas is bombarded by gargantuan amounts of input data. The competition and inhibition mechanisms select only a fraction of these inputs to be processed and recorded in long-term episodic memory. The working memory must be continually emptied to allow for new sensations to be taken into consideration. After the information is recorded in long-term memory, the association memory can be made available for future operations. As one of the determinants of recording information in the long-term memory is repetition of the stimuli in given time periods, the association memory has to record these information for at least the duration of the said periods. The timeframe for recording data in the long-term memory is dependent on the life strategy of the embodied intelligence. If the memory resources are limited, the forgetting mechanism, activated in relation to unused data may be beneficial. The strategy for forgetting, that was an evolutionary achievement for animals, we have to determine on the basis of economical analysis.

5.     Communication with the cognitive network

Recognizing these remarkable characteristics is however impossible without first establishing a language for communication. Similar problems are present in approaches trying to discover and assess the level of consciousness of living organisms. We are witnessing an endless discussion on self-consciousness of apes, dolphins, elephants, dogs, cats and other species, although they possess similar to humans: social behaviors, body language, somatic reactions and even facial expressions. This should, theoretically, make conducting appropriate experiments easier. We can but imagine, what would the communication problems be in relation with an entity that would resemble nothing that we have ever seen, if such an entity is not provided with a proper language beforehand.

It seems that the contemporary level of speech analysis and simulation offers a possibility of equipping a neural network with capability to understand speech and to use it consciously in contact with other entities. This capability must be developed as a learning process. The network’s ability to recognize and categorize objects must be used in parallel in two modalities. There must be presentation of objects and simultaneous naming of the said objects. The mental representations of objects and their names, recognized at the level of cognitive functions, will be simultaneously transferred to CE, where created will be a universal pattern for a recurring new excitation configurations related to these objects. A similar situation of repeating sequences of words that coincides with certain operations on the presented objects, may result in creation of patterns corresponding to syntax relations between words. If these sets of symbols expressed as sequences of phonemes will be fed to the speech generator, the network will gain ability to express its own thoughts. This way a new symbolic language, expressing the mental processes within the network, will be created.

Using a complex symbolic system will allow the network to create abstract ideas, with a higher level of generality. This requires a conscious operation on sentences of that language, sentences that also are episodes recorded in the episodic memory of the speech centre. Activating these lingual episodes may be achieved by exciting the input layers of the speech centre by signals originating in CE on the basis of associations with ideas being processed in CE structures. A different possibility is a conscious focusing of attention on uttered sentences or following a verbalized logical reasoning. In such a case, lingual episodes will be fed to CE and possibly connected to logical symbols or additional emotional motivators (like ambition, stubbornness, fear, etc.). This will force the network to search for complex configurations (via “curiosity”) connected with ideas defined by the speech centre. This way a conscious fulfillment of curiosity will be demonstrated, which will result in conscious cognitive actions.

6.    Internal communication – language of mental states.

External, symbolic knowledge must be translated into the language of neural excitations. The language of excitation configurations is individual for each and every network, as it stems from that network’s experiences: the set of experiences or even the order in which they were gained. Moreover, natural neural networks are characterized by unique configuration of neural connections. Due to this, every network deconstructs and processes an image or episode in a different way on the intermediary levels. In consequence, there is no universal system for recognizing and categorizing of notions or ideas by the network. Every network creates its own individual language of mental configurations, which, due to high complexity of networks and individual history of gaining experiences, self-teaching and teaching, makes learning such internal language impossible.

This is why an automatic translating system for external, encyclopaedic knowledge remains an impossibility. Knowledge may only be translated via a process of presenting the said knowledge via the senses. It must be “lived through” by the system and connected to previous experiences. The process of such translation will therefore be similar to the processes of learning exhibited by the human brain. Despite the artificiality of the network and seemingly easy access to its mental states, the learning process will be just as slow.

This will be true especially in relation to new, complex ideas that will require individual approach and patience in order to find a form that would be accessible for every individual network. Lack of universal internal language makes it impossible for the entities of the external world to communicate using this language. However, it is possible for the networks to create a universal symbolic language that will allow them to express their mental states, just as it happens with humans. This language will allow communication, coordination, learning or social action.

Individual language of mental state configuration serves as a barrier against intruding into a human personality. Every conscious brain will be forced to create its own model of the world and its own viewpoint, stemming from the personal experiences, learning and self-learning, pondering and internal, verbalized discussion.

Even if we copied the exact same neural networks, filled with preconceived knowledge, such approach does not guarantee creating uniform personalities. Intelligent entities, just as their independent “life” starts, will begin to gather and categorize differentiated experiences which will determine their form and function. On the other hand the infallibility and processing speed of machine memory, no limitations as to its capacity and development of knowledge generalization levels may result in emerging of an intelligence and self-consciousness far suppressing the human ones.

7.     Conclusions

The proposed architecture of the cognitive neural network will be capable of categorizing the recognized objects, recording and recalling episodes from its own existence/past, logical thinking and understanding its environment. What is most important, the network will possess motivation to act, to actively care for the comfort of its operation and to gather and record knowledge due to its own curiosity. The ability to act intelligently will result in self-consciousness and many other higher mental functions. These spectacular effects result from the ability of the connectionist network to recognize and categorize, from its ability to record its own experiences and sensations in the episodic memory and from the ability to recall these memories at will. It seems that these singular abilities may be well aided by complementing them by symbolic knowledge that humankind has gathered in available databases.

However, the issue is not as simple as it may appear. Networks with a symbolic architecture are able to express words and ideas recorded in their memory. The operation however resembles re-playing of stored data. Humans are also capable or reading a given text. The ability to mechanically speak the words with or without understanding is not a great feat. Human brain, equipped with connectionist architecture is able to, at any given moment, activate the mechanism for recognizing and understanding of the words being read. This ability is unknown to a network with a symbolic architecture in which word-symbols are not processed into an individual, internal language of neural configuration excitation. Association memory has in such a case no basis for correlation. The “Self” block receives no signals of understanding. There is no self-consciousness.

The example of the human brain proves that there is a possibility of a hybrid architecture. In such a system, the symbolic layer is analyzed by the cognitive network and further operations are carried out on the mental representations of the input signals. This can be replicated in artificial brains without difficulties. The downside of this characteristic is that we cannot simply copy, into an artificial brain, a piece of software containing symbolic knowledge as in case of e.g. algorythimc databases. This is because we cannot foresee the method in which a given connectionist network will categorize information. With a large number of elements, this can be a chaotic process and its effects can be unique. What is more, even if the networks are identical, the categorization depends on previous experiences. This is why the process of “translating” the symbolic knowledge into the language of internal mental states must be realized via a strenuous process of individual learning. The effects of this learning could be different and depend on “capabilities” of a given network, its motivation and hierarchy of “values.” This way we know that each such network will possess unique personality. In every case we will have to deal with an individual Person.

References:

  1. Duch W. (2010) Architektury kognitywne, Neurocybernetyka teoretyczna, Ch. 14, pp. 329-361, editor R. Tadeusiewicz.,
  2. Galus W.L. (2011) Machine Mind, International Journal of Machine Consciousness (in print)
  3. Baddeley A.(2000) The episodic buffer in working memory, Trends in Cognitive Sciences, Vol. 4, No. 11,
  4. Starzyk J.A., Graham J.T. Raif P., Tan A-H., (2011). Motivated Learning for the Development of Autonomous Systems, Cognitive Science Research (In print).
  5. Starzyk J.A., Prasad D.K. (2011) A Computational Model of Machine Consciousness, International Journal of Machine Consciousness (In print).
  6. Starzyk J.A. (2011) Mental Saccades in Control of Cognitive Process (In print)
  7. Edelman G.M., (1992) Bright Air, Brilliant Fire, On the matter of the Mind (1999), tłum. Przenikliwe powietrze,Starzyk J.A. jasny ogień. O materii umysłu. Warszawa: PIW 1999.
  8. Nuxoll, A.M., & Laird, J.E. (2007). Extending cognitive architecture with episodic memory. In Proceedings of the twenty-second AAAI conference on artificial intelligence. Vancouver, BC.
06/03/2011

Pamięć epizodyczna – klucz do myślenia

- autor: Wieslaw Galus

English version:  http://mindconsciousness.wordpress.com/2011/03/07/episodic-memory-%E2%80%93-key-to-thinking-2/

Abstract:

Inteligentne maszyny powinny posiadać motywację do poszerzania wiedzy poprzez własne nowe doświadczenia i wyciąganie wniosków z przeszłych doświadczeń. W tym celu powinny dysponować samoświadomością umożliwiającą wykazywanie wyższych funkcji psychicznych, takich jak ambicja, ciekawość, upór, odwaga itp. W niniejszej pracy zaproponowano schemat blokowy sztucznego mózgu aspirującego do spełniania wyższych funkcji psychicznych, charakterystycznych dla mózgu ludzkiego. Wskazano na kluczowe znaczenie pamięci epizodycznej i pamięci asocjacyjnej a także ich wzajemne relacje z uwzględnieniem pamięci krótkotrwałej, roboczej, asocjacyjnej i długotrwałej. Zaproponowano strukturę pamięci epizodycznej i jej wykorzystanie w nowej architekturze emergentnej sieci koneksjonistycznej. Wykazano hermetyczność wewnętrznego języka neuronowych korelatów zjawisk mentalnych i trudności w tworzeniu architektur hybrydowych.

Key words:  self-consciousness; cognitive architectures; curiosity; machine reasoning; understanding; ; episodic memory, schematic of artificial brain, mind


1. Wstęp

Sztuczna neuronowa sieć kognitywna powinna wykazywać funkcje psychiczne podobne do tych, które przejawia umysł naturalny. Szczególnie sieci kognitywne wykazujące się motywacją w postaci konieczności rozumienia rzeczywistości i ciekawością imitowaną właściwymi mechanizmami eksploracji pamięci i otoczenia opisane w pracy Machine Mind [Galus 2011][2], aspirujące do posiadania samoświadomości, cechować się powinny bogatym repertuarem zachowań i procesów myślowych charakterystycznym dla zwierząt lub człowieka. Nie oznacza to, że każda sieć sztuczna może posiadać psychikę dorównującą, lub przewyższającą ludzką.

Zacząć trzeba od prześledzenia w jaki sposób w mózgu rejestrowane są wrażenia odbierane przez zmysły. W wymienionej pracy przedstawiono sposób rozpoznawania i kategoryzacji obrazu. Zaproponowany schemat, opisany i uznawany przez wielu badaczy, wystarczający jest do rozpatrywania zagadnień motywacji i mechanizmów aktywacji pamięci w celu wykonywania funkcji poznawczych przez umysł. Jednakże, w zwykłej aktywności osobniczej, spotykamy się z problemem rozpoznania i rejestracji dynamicznie zmieniającego się środowiska. Odnosząc to do wzrokowej obserwacji otoczenia, widzimy obrazy ruchome, dynamicznie się zmieniające, epizody składające się z serii obrazów przypominające urywki filmów. Wyższe pola sieci, odpowiedzialne za wytworzenie qualii nie są więc pobudzane stabilną konfiguracją neuronów, lecz w węzłach wejściowych następują szybkie zmiany tych konfiguracji, których dynamika zależy od tempa napływających wrażeń.

Wiemy, że zarówno ludzie, jak i zwierzęta mają zdolność zapamiętywania obserwowanych epizodów a miejsce, gdzie są one zapisywane nazywamy pamięcią epizodyczną. Jest to zwykle istotny blok na schematach prezentujących funkcje kognitywne umysłu. Jednakże dotychczas realizowane modele pamięci epizodycznej odbiegają od działania pamięci epizodycznej w mózgu ludzkim. Aczkolwiek jest powszechnie rozumiane znaczenie funkcji pamięci epizodycznej dla procesów poznawczych, to dotychczas nie jest należycie rozumiane jak proces zapamiętywania epizodów przebiega w mózgu ludzkim. W niniejszej pracy przedstawiona zostanie hipoteza jak taki proces może przebiegać, jak uzupełnić architekturę sztucznych sieci neuronowych, aby były zdolne do rejestracji i przypominania sobie pożądanych epizodów i jakie konsekwencje wynikają z zaproponowanego modelu dla psychiki tak zorganizowanych sztucznych sieci.

2. Wymagania dla sieci kognitywnej

Wydaje się oczywiste, że w celu uzyskania wyższych funkcji psychicznych podobnych do mózgu ludzkiego, sieć powinna mieć charakter koneksjonistyczny o architekturze emergentnej [Duch, 2010][1]. Powinna ona spełniać warunki przedstawione w pracy Machine Mind [Galus, 2011][2]. Cechą charakterystyczną takiej sieci jest jej wielopoziomowa, hierarchiczna struktura, duża pojemność pamięci i pętle sprzężenia zwrotnego umożliwiające pobudzenia zstępującej hierarchii pól komórek nerwowych. Oprócz pól i warstw tworzących strukturę hierarchiczną wyodrębnić należy obszary wyspecjalizowane, odpowiedzialne za funkcje mowy, emocji, rozumowanie, logikę, przekształcenia geometryczne, matematyczne, kontrolę czasu i planowanie a także pola motoryczne, sterujące ciałem, aparatem mowy i sensorami. Sieć neuronów modyfikowana przez wzmocnienie synaptyczne wydaje się niewystarczającym narzędziem do zapamiętania szybkiego, jednorazowo napływającego wielkiego strumienia danych, które powinny być zarejestrowane w pamięci epizodycznej. Wydaje się konieczne istnienie towarzyszących neuronom komórek pamięciowych, które zdolne są do trwałej zmiany stanu pod wpływem jednorazowego elektrochemicznego bodźca dostarczonego przez sieć. Być może rolę taką spełnić mogą astrocyty, którym przypisuje się istotną rolę w procesach przetwarzania informacji w mózgach ludzkich i zwierzęcych. W każdym razie sieć sztuczna musi posiadać w swoich węzłach komórki posiadające możliwość trwałej zmiany parametrów transmisji sieci. Próbkowane odcinki każdego epizodu, niczym klatki filmu, muszą być rejestrowane w kolejnych komórkach pamięci. Pamiętając, że każdemu perceptowi i scenie odpowiada rozległe drzewo pobudzeń grup komórek wstępujących (połączenia ascedantne) na wyższe piętra hierarchii przetwarzania, wydaje się, że rejestrowanie kolejnych konfiguracji pobudzeń tych komórek spowoduje zalew pamięci olbrzymim strumieniem zbytecznej informacji. Ze sposobu konstruowania obrazów w sieci koneksjonistycznej o hierarchicznej strukturze, wynika niezwykła zdolność do kompresji rejestrowanej informacji. Ponieważ na szlaku przetwarzania występują pola i grupy komórek wyspecjalizowane w rozpoznawaniu poszczególnych aspektów analizowanego obrazu, to w kolejnych konfiguracjach pobudzeń odpowiadających następującym po sobie odcinkom czasu rejestrowane będą tylko te komórki, które rozpoznają aspekty zmienne. Pozostałe, skojarzone z obserwowaną sceną zestawy konfiguracji pozostaną niezmienione, a przy próbie odtwarzania epizodu, wraz z komórkami rejestrującymi zmiany, tworzyły będą kompletny i dynamicznie zmienny przebieg epizodu.

Wszelkie informacje trafiają do głównego ośrodka zarządzającego (Central Executive – CE) najwyżej umieszczonego pola w semihierarchicznej strukturze przetwarzania informacji. W wielu prezentowanych dotychczas pracach przypisuje się mu rolę analizy sytuacji, czyli myślenia, kojarzenia abstrakcyjnych pojęć, planowania, motywacji i wyznaczania celu, koncentracji i przełączania uwagi, odwołania do pamięci, aktywizacji procesów wykonawczych i kontroli skutków działania. [3,5,8]. Tak szeroki zakres zadań stawianych przed CE powoduje, że dotychczas nie wskazano na szczegółową budowę tego ośrodka umożliwiającą ich efektywne wykonywanie. W przywołanych wyżej pracach, podobnie jak w innych usiłowaniach zaproponowania architektur kognitywnych, funkcje świadomości przeniesiono do tego centralnego ośrodka, nie objaśniając, jak one mają być wykonywane, lub uznając, że ich uzyskanie na danym etapie nie jest w ogóle możliwe.

W pracy Starzyka z Uniwersytetu Ohio [5], omówiono mechanizm koncentracji uwagi i opisano układy sterowania efektorami oraz kontroli położenia. Ulokowany w CE mechanizm przełączania uwagi, polegający na konkurencji konfiguracji pobudzeń docierających do pamięci asocjacyjnej będącej częścią CE, selekcjonowałby reprezentacje mentalne wygrywające, według mechanizmu winner-takes-all (WTA), tworząc w efekcie strumień świadomości. Pamięć epizodyczna będąca podstawą procesu uczenia, zapełniana byłaby tymi wyselekcjonowanymi informacjami przekazywanymi z pamięci semantycznej. Za planowanie i myślenie odpowiedzialny byłby blok „Planowania i Myślenia” uruchamiający świadome kierowanie uwagi, odtwarzanie epizodów, sterowanie efektorami i współpracujący z blokiem definiującym cele i motywacje działania. O ile można wyobrazić sobie strumień świadomej rejestracji bodźców bieżąco dopływających do poziomu ich porównywania i selekcji, o tyle dalej nie jest jasny cel i sposób przywoływania epizodów przez świadomość, która wcześniej musi się pojawić, zanim zacznie spełniać swą selekcyjną i regulacyjną rolę.

3. Model sieci mózgopodobnej

Dysponując hipotezą dotyczącą działania pamięci epizodycznej, a także uwzględniając zasadę konieczności rozumienia oraz działanie mechanizmów ciekawości zgodnie z ich opisem zamieszczonym w pracy Machine Mind [Galus, 2011], można się pokusić o zaproponowanie architektury sieci spełniającej funkcje mózgu ludzkiego wraz z manifestacją samoświadomości i innych złożonych stanów psychicznych.

Zarys takiej architektury przedstawia rysunek 1.

Schemat mózgu 1

Opis rys.1. Sygnały wstępujące oznaczono linią ciągłą, sygnały zstępujące – linią przerywaną. (na rysunku zaznaczono jedynie główne szlaki przekazywania pobudzeń pomiędzy blokami operacyjnymi sztucznego mózgu). Linie punktowe (Center lines) oznaczają powtarzanie bloków w kierunku pionowym (dla określenia poziomów przetwarzania, jak i w kierunku poziomym (dla oznaczenia modalności zmysłowych). Poszczególne bloki zmysłowe, tworzące poziomy przetwarzania A1, … A4, … Ak odpowiadają polom V1, … V4, … Vk w mózgu ludzkim. Mózg oddziaływa z środowiskiem poprzez sensory i efektory. Blok Body Internal Parameters, to zestaw czujników charakteryzujących stan fizyczny sieci lub ciała agenta w przypadku inteligencji ucieleśnionej. Struktura wewnętrzna bloków przedstawiona jest na rys. 2.

Najważniejszą częścią, przedstawionego na rysunku modelu, jest sieć połączeń pomiędzy poszczególnymi obszarami „mózgu”. Szczególnie ważną i dotychczas niedocenianą rolę spełnia sieć połączeń wstecznych (descedentnych), odpowiedzialnych za działanie mechanizmów ciekawości. Należy pamiętać, że przedstawione połączenia przedstawiają wybrane główne szlaki transmisji pobudzeń i że symbolizują one wiązki połączeń neuronowych zawierające niekiedy miliony włókien neuronowych łączące poszczególne pola przetwarzania umożliwiając grupom komórek – węzłom sieci przekazywanie stanów pobudzeń.

Poszczególne obszary jedynie funkcjonalnie stanowią strukturę semihierarchiczną. Faktycznie stanowić one mogą części jednolitej struktury sieciowej o bardzo podobnych właściwościach. Szczególnie obszar CE nie musi stanowić jednolitej całości. Może on być rozdzielony pomiędzy ośrodki wyższych funkcji psychicznych zespalając ich działanie. Szczegółowa lokalizacja uwarunkowana może być wymogami minimalizacji długości połączeń przy zapewnieniu optymalnego współdziałania.

Podział poszczególnych obszarów na warstwy ma charakter symboliczny. To pola sensoryczne i percepcyjne mają klasyczną postać sieci neuronowej ponieważ pełnią funkcje kognitywne. Ich struktura wielowarstwowa wymagana jest dla umożliwienia grupom komórek wypełniania funkcji realizowanym w mózgu ludzkim przez pojedyncze lub nieliczne neurony. Komórki pamięci stałej nie stanowią odrębnej warstwy w sensie sztucznych sieci neuronowych lecz raczej towarzyszą komórkom pamięci asocjacyjnej i epizodycznej krótkotrwałej. Być może spełniać powinny rolę podobną jaką spełniają w mózgach zwierzęcych astrocyty. Komórki pamięci asocjacyjnej spełniają funkcję porównywania, czyli obliczania korelacji konfiguracji ekscytacji docierających do tych komórek z niższych poziomów..

Fragment struktury sieci kognitywnej odpowiadający wyspecjalizowanemu blokowi przedstawiony jest na rys. 2.

Schemat pamięci epizodycznej

Rys. 2. Wytwarzanie pamięci epizodycznej w zwykłej pamięci,   sekwencje czasowe zamieniane są na rozkład przestrzenny.   Pobudzenie w chwilach t1, t2, …. tn rejestrowane są w komórkach c1,c2,…cn leżących w sąsiedztwie. Lokowane są tam one kolejno, gdy komórka o niższym numerze zmieniła swój stan rejestrując poprzednie pobudzenie. Silne lub powtarzające się bodźce utrwalane są przy pomocy komórek pamięci trwałej lm1,…lmn odpowiadającym komórkom pamięci asocjacyjnej. Pobudzenia filtrowane przez pamięć asocjacyjną transmitowane są poza blok do struktur powiązanych w sposób przedstawiony na rys. 1

Poszczególne warstwy oznaczone numerami 1,2,3,4. oznaczają wyspecjalizowane warstwy zawierające komórki „neuronowe” – węzły spełniające specyficzne role. Ze względu na wypełniane funkcje grupy komórek nazywane są w poszczególnych warstwach odpowiednio:

  1. - warstwy wejściowe – Input Layers (IL)
  2. - pamięć krótkotrwała i pamięć epizodyczna krótkotrwała – Short-term Memory (SM) and Short-term Episodic Memory (SEM)
  3. - pamięć asocjacyjna – Association Memory (AM)
  4. - pamięć długotrwała i pamięć epizodyczna długotrwała – Long-term Memory (LM) and Long-term Episodic Memory (LEM)

Komórki pamięci epizodycznej krótkotrwałej SEM oznaczone na rys. 2 jako „n” i długotrwałej LEM, oznaczone ln , oraz komórki pamięci asocjacyjnej Cn , są odrębnymi komórkami nerwowymi rozmieszczonymi w sztucznej korze w sąsiedztwie przestrzennym zgodnie z hipotezą lokalności. Są one połączone pomiędzy sobą w taki sposób, że pobudzenie może być przekazywane bezpośrednio do kolejnych, sąsiednich komórek. Pobudzenie to propaguje się automatycznie do kolejnych komórek pamięci epizodycznej krótko i długotrwałej, powodując „wyświetlenie” zapamiętanej sekwencji. Jednakże wcześniej epizody muszą być odpowiednio zapisane w tej pamięci. Dzieje się tak, dzięki specyficznemu działaniu komórek pamięci asocjacyjnej. Przedstawiam hipotezę, że dla osiągnięcia założonego efektu, działanie tego zespołu komórek powinno być następujące:

  • bodźce odbierane przez receptory tworzą wzorce obiektów rozpoznawane w warstwie wejściowej (nr 1), tworzącej kognitywną sieć neuronową.
  • w najwyższej warstwie sieci, którą nazywać będziemy pamięcią roboczą krótkotrwałą, rejestrowane będą rozpoznane wzorce odpowiadające kolejnym odcinkom czasowym w chwili tn. Zestaw komórek nerwowych będących korelatem neuronowym tych zmieniających się wzorców będzie ulegał zmianie, a więc będzie inny w każdym momencie czasowym tn. Ponieważ w krótkim odstępie czasu większość elementów sceny nie zmienia się w znaczącym stopniu, to większość komórek nerwowych będzie pozostawać w stanie nie zmienionym. Zmianom ulegać będzie jedynie część komórek, odpowiedzialna za rejestrowanie zmiennych aspektów obserwowanej sceny. Na rysunku 2. tym grupom komórek odpowiadają kwadraciki oznaczone tn w warstwie SEM (warstwa nr 2), to jest tak jak momenty czasowe, którym odpowiadają.
  • Wszystkie te konfiguracje bodźców z warstwy SEM, trafiać powinny do kolejnej warstwy komórek, odznaczających się specyficznymi właściwościami. Funkcjonują one w taki sposób, iż jeśli kolejne sygnały nie zmieniają się przez dłuższy czas, to komórki te powodują zapisanie wzorca pobudzenia w pamięci trwałej w warstwie LM. Niezależnie od tego procesu sygnał z tych komórek przekazywany jest do innych obszarów (bloków), znajdujących się wyżej w hierarchii przetwarzania. Natomiast, jeśli nie ma korelacji pomiędzy wzorcami pobudzeń (co oznacza, że następują zmiany konfiguracji pobudzeń), to nowa konfiguracja zapisywana jest w nowych komórkach pamięci oznaczonych jako Cn. Ze względu na rozpoznawanie stopnia korelacji wzorców i ich kierowanie w zależności od tego, czy korelacje takie występują, czy też nie, to komórki te nazywamy pamięcią asocjacyjną AM (warstwa nr 3). Jeśli z jakiegokolwiek powodu stan pobudzeń neuronowych w pamięci asocjacyjnej będzie się przedłużał, to musi on być utrwalony w pamięci trwałej (LM). Jeśli w grupie sąsiadujących komórek lm zapisana zostanie sekwencja kolejnych konfiguracji odpowiadająca zmieniającej się scenie w kolejnych momentach czasowych, to pamięć taka nazywana będzie pamięcią epizodyczną długotrwałą LEM (warstwa nr 4).

Tak zbudowany zespół komórek wykonywać może funkcje rozpoznawania wzorców, oraz ich zapamiętywania w pamięci. W zależności od sposobu rozpoznawania stopnia ich korelacji, zapamiętywane one mogą być w pamięci trwałej, lub przekazywane do wyższych pól hierarchii przetwarzania. Należy zwrócić uwagę, że w proponowanym modelu komórki pamięci epizodycznej tn nie wyróżniają się niczym spośród innych komórek pamięci krótkotrwałej i podobnie komórki pamięci epizodycznej nie wyróżniają się spośród innych komórek pamięci trwałej ln. Tak więc mamy tutaj do czynienia z wytwarzaniem pamięci epizodycznej ze zwykłej pamięci trwałej, typowej dla takiej struktury. Ponadto należy zauważyć, iż sieć taka zamienia sekwencje czasowe, na sekwencje przestrzenne, zapisując informację z upływających chwil w sąsiednich komórkach pamięci. Ich kolejne odtwarzanie znów przekształca informacje dystrybuowaną przestrzennie w sekwencję scen trwających w czasie odtwarzania zapamiętanego epizodu. Na podobnej zasadzie zapisywane mogą być procesy mentalne dotyczące logicznego, abstrakcyjnego, matematycznego myślenia, tworząc rodzaj epizodów mentalnych. Do tych przemyśleń system może powracać przypominając je sobie w razie potrzeby, podobnie jak epizody z historii życia.

Poszczególne obszary przetwarzające zbudowane są z podobnych bloków – zespołów komórek, tworzących strukturę podobną do kory mózgowej. Podobnie, jak w opisanym wyżej przypadku CE, rozmieszczonego pośród innych wyspecjalizowanych bloków sztucznego mózgu, tak i pozostałe bloki mogą być hipotetycznie jedną warstwą „kory”, podzieloną na wyspecjalizowane obszary. Semihierarchiczna struktura przedstawiona na rysunku 1. utworzona jest jedynie przez system połączeń i kolejność przekazywania informacji pomiędzy poszczególnymi blokami. Poza kolejnością przekazywania ascedentnych sygnałów, obszary te wyróżnione są poprzez przyłączenie do nich organów komunikacji ze środowiskiem (otoczeniem) i z sygnałami płynącymi z własnego ciała. I tak obszary do których przyłączone są sensory, tworzą pola sensoryczne z ich mapami topograficznymi i retinotopowymi. W zależności od rodzaju zmysłów definiowanych przez rodzaj przyłączonych sensorów mamy do czynienia z różnymi modalnościami wejść sensorycznych (blok: Sensory Input). Części naszej sztucznej kory połączone z efektorami stanowić będą namiastkę kory ruchowej (blok: Motors, Effectors, Actuators). Odpowiednia część sterująca efektorami sterować będzie aparatem mowy oraz położeniem i nastawami receptorów dostarczającym odpowiedniej informacji zmysłom. Jeśli nasz sztuczny mózg zostanie w pełni ucieleśniony, to powinniśmy mu dostarczyć informacji o stanie jego ciała. Daje to możliwość wykorzystywania dobrze znanych systemów motywacji w postaci minimalizacji uogólnionego „bólu”. Jeśli system ucieleśnionej inteligencji zdolny jest do określania wielu parametrów charakteryzujących stan jego „ciała”, to można ustanowić hierarchię bólu, ustanawiając skalę pobudzeń proporcjonalnie do wagi zagrożenia sygnalizowanego przez ból. Jednakże minimalizacja „bólu cielesnego” nie byłaby tutaj motywacją dominującą. Sygnały bólu przesyłane powinny być do strefy centralnego kierowania (Central Executive, CE), gdzie porównywano by je z innymi sygnałami, a po „zrozumieniu” ich znaczenia podejmowano by decyzję co do strategii ich minimalizacji.

 

Sprzężenia obejmujące ośrodki emocji (Mental Pain & Emotions), ciała (Body & Pain) i wykonawcze (Motors, Effectors & Actuators) odpowiadają jedynie za szybkie odruchy w reakcji na nagłe zagrożenie, w ramach instynktu samozachowawczego, bez udziału świadomości.

 

Funkcje poznawcze realizowane są głównie na poszczególnych poziomach obszarów przetwarzania wrażeń zmysłowych

 

Pamięć trwała systemu jest rozproszona i usytuowana jest zarówno w bloku CE, w zakresie epizodów z przeszłości, jak i w bloku Speech & Language, w zakresie semantycznym i syntaktycznym a także w innych wyspecjalizowanych blokach w zakresie operacji logicznych, rozumowania, przekształceń geometrycznych, matematycznych i innych. Pamięć epizodyczna niższych pól przetwarzania, odpowiadających mózgowym polom V1,…,V4 i wyższym zawiera komponenty wrażeń epizodycznych wykorzystywanych przy odtwarzaniu epizodów z wyższych pól. Pamięć trwała zapewnia utrwalenie szlaków przekazywania informacji rozpoznanej w warstwie 2 i wyselekcjonowanej jako zgodna z oczekiwanym wzorcem przez pamięć asocjacyjną w warstwie 3 do wyższych obszarów przetwarzania. Utrwalenie następuje w następujących przypadkach:

  • w przypadku bardzo silnych bodźców i silnego pobudzenia. Może to być pobudzenie zewnętrzne, przez sygnały docierające z pól percepcyjnych, jak i wewnętrzne, przez sygnały dochodzące z innych pól przetwarzania.

  • w przypadku często powtarzających się bodźców. Powtórzenia mogą następować na skutek pobudzeń częstymi sygnałami zmysłowymi, jak i też sygnałami przesyłanymi zwrotnie z wyższych poziomów, z komórek, które leżą na szlaku transmisji konfiguracji pobudzeń do CE.

  • w przypadku synchronizacji bodźców z sygnałem przesyłanym intencjonalnie lub nieintencjonalnie z wyższych obszarów, warunkującym zapis w pamięci trwałej, a więc tworzącym wzmocnienie danego bodźca, przy równoczesnym hamowaniu pozostałych, także konkurujących o uwagę, czyli o przekazanie do wyższych pól przetwarzania.

Należy dopuścić ewentualność, iż procesowi zapamiętywania szlaków ascedantnych towarzyszyć będzie równoczesne utrwalenie równoległego szlaku descedentnego. Komórki pamięci trwałej mogą dysponować taką funkcją, jednakże nie ma wyników badań wskazujących, że taka korelacja zachodzi w mózgach zwierzęcych. Wykrycie relacji pomiędzy wykonywaniem funkcji asocjacyjnych i pamięcią trwałą jest pilną potrzebą badań neurologicznych, jeśli chcemy zrozumieć funkcjonowanie mózgu ludzkiego. Szczególne nadzieje można wiązać z wyjaśnieniem roli astrocytów w tych procesach.

Świadomość wyłania się emergentnie w bloku nazwanym „centralne kierowanie” (CE). W bloku Self & Understanding, następuje jedynie zarejestrowanie stanu rozumienia i samoświadomości, które de facto powstaje w bloku CE. Podobnie wszystkie wyższe funkcje psychiczne mogą być rozpoznawane w pamięci asocjacyjnej bloku CE i „odnotowane” jako „przeżywane” w części kory, (bloku) nazwanej „Self”. Wspomnianemu powyżej intencjonalnemu przesyłowi sygnałów koordynujących włączanie pamięci trwałej, odpowiada świadomy mechanizm „uwagi”. W kategoriach selekcji konfiguracji stanów mentalnych oznacza to, iż skorelowane komórki CE wysyłają silne bodźce zwrotne, wsteczne, do niższych pól, generując silne pobudzenia wygrywające w konkurencji selekcji i przesyłania ponownie do pól wyższych. Korelacje pomiędzy odpowiednimi komórkami CE a grupami zapisującymi konfiguracje stanów w polach niższych, powstają w procesie uczenia i kolekcjonowania doświadczeń, przez co powstają szlaki transmisyjne (połączenia) utrwalane w pamięci trwałej. Te same sygnały wysyłane spontanicznie, w wyniku pobudzenia nieskojarzonego ze stanami świadomościowymi, oznaczało będzie nieświadome „przełączanie uwagi”.

4. Pamięć epizodyczna – funkcjonowanie

Pamięć epizodyczna pozwala na zapisanie sekwencji zdarzeń (scen) lub sekwencji stanów. W tym celu umysł musi dokonać poszatkowania zdarzenia na krótkie odcinki czasowe i zapamiętywać je w kolejnych komórkach odpowiadających sekwencji czasowej wynikającej z czasu trwania tych odcinków. Z pewnych przesłanek można wnosić, że te kolejne komórki, to komórki sąsiednie, co byłoby zgodne z hipotezą lokalności przestawioną w pracy Machine Mind [Galus, 2011]. Zwykle tylko nieliczne szczegóły obrazów różnią poszczególne sceny pomiędzy sobą. Sceny zapamiętywane są w sąsiednich kolejnych komórkach. Komórki te połączone muszą być szeregowo, tak, żeby pobudzenie jednej z nich powodowało wyładowanie całej serii kolejnych komórek. Umożliwia to dostęp do kompletnych epizodów na żądanie i ich odtwarzanie w całości. Możliwe jest także pobudzenie odtwarzania od dowolnej sceny w zapamiętanym epizodzie, najlepiej kojarzącej się z aspektem analizowanym na poziomie świadomości. Po takim pobudzeniu, uruchamiane byłyby kolejne, szeregowo połączone komórki w konfiguracji odpowiadającej zapamiętanym epizodom powodując intencjonalne lub przypadkowe „przypominanie sobie” przeszłych wrażeń. Sygnały pobudzające kierowane z innych bloków, nie musiałyby docierać do pamięci roboczej, lecz mogłyby pobudzać do odtwarzania epizody konfiguracyjne bezpośrednio z pamięci trwałej.

Powstaje pytanie jaka jest wierność takiego zapisu i późniejszego odtwarzania utrwalonych epizodów? Dotyczy to zarówno rozdzielczości czasowej związanej z częstością próbkowania, jak i rozdzielczości przestrzennej lub bardziej ogólnie zmysłowej. Dla rejestracji wrażeń wzrokowych, czas próbkowania epizodów musi być dostatecznie krótki, aby powstawało wrażenie ciągłości obrazu. Natomiast nie może on być krótszy niż czas potrzebny na przetworzenie obrazu w jego dynamicznie zmieniających się aspektach. Najwięcej danych na ten temat dotyczy mózgu ludzkiego. Wydaje się, że w tym przypadku czas próbkowania odpowiada rejestracji od kilku do kilkudziesięciu klatek na sekundę. Krótszy czas próbkowania wymagany jest dla zmysłu słuchu i związany jest ze zdolnością słuchu do rozróżniania często powtarzających się dźwięków. Czasy te odpowiadają częstotliwości kilkuset Hertzów. Inne zmysły nie wymagają tak wielkiej częstości próbkowania sygnałów.

Rozdzielczość przestrzenna odtwarzanych obrazów ma wybitnie zmienny charakter. Wiemy, że wspominając krajobraz widzimy początkowo ogólny zarys, koloryt i dominujące obiekty. Zwracamy także uwagę na elementy dynamicznie zmienne. Oznacza to, że do poziomu świadomości, czyli ośrodka CE porównywania wzorców, docierają sygnały z wyższych poziomów pamięci asocjacyjnej. Biorąc za przykład dobrze znany pejzaż, przyjąć możemy, że CE rozpozna świadomie brzeg morza, wodę i słońce nad wodą. A także przelatującą mewę. Wrażenia te generowane będą kolejno w wyniku dwóch zmiennych (variable) wymuszających napływ do CE zmiennych konfiguracji bodźców. Pierwsza zmienna, to wyładowania kolejnych komórek krótkotrwałej pamięci epizodycznej (SEM). Napływające kolejno fale pobudzeń rozpoznawane będą jako ruch mewy na tle krajobrazu. Druga zmienna to przełączający się mechanizm uwagi, skupiający się na głównych elementach krajobrazu, pozwalający wyróżnić kolejno piasek plaży, linię brzegową, wodę morską, linię horyzont i słońce na błękitnym niebie. Mechanizm ten opisany w pracy [3] odpowiada postulowanemu w pracy [2] mechanizmowi konkurencji pobudzeń. Kolejność postrzegania tych elementów regulowana być może przez mechanizm błądzenia mentalnego (mental saccades) także analizowany w pracy [3], analogicznego do ruchów błądzących gałki ocznej.

Jeżeli skupimy swą uwagę na szczegółach (co oznacza, że mechanizmy konkurencji wyselekcjonują nowe obiekty zainteresowania, czyli skoncentrują uwagę), to będziemy mieli możliwość dojrzenia drobniejszych szczegółów krajobrazu. Np. załamujących się fal na wodzie, śladów stóp na piasku i poruszających się skrzydeł mewy. Jak możliwe jest to zwiększenie rozdzielczości odtwarzanego epizodu? Dzieje się tak poprzez pobudzenie głębiej leżących struktur pamięci w polach odpowiedzialnych za rozpoznanie szczegółów obrazu. Tak więc spodziewać się należy, w odniesieniu do mózgu naturalnego, połączeń zwrotnych, descedentnych, z wyższych poziomów hierarchii przetwarzania na poziomy niższe, bliskie polom percepcyjnym. Podobnie też należy projektować połączenia w systemach sztucznych. Ten system połączeń zwrotnych, wstecznych, zstępujących opisywany był w pracy [2] i związany jest z generacją wzorców do porównań w ramach mechanizmu nazywanego „ciekawością”. Nazwę taką uzyskał, ponieważ jest to mechanizm penetracji i eksploracji własnej pamięci a więc pełni funkcje poznawcze, umożliwiając retrospekcję, refleksję i przez asocjację, rozumienie nowych zjawisk docierających z pól percepcyjnych. To pobudzanie pamięci epizodycznej może mieć charakter świadomy, ponieważ sygnały pobudzenia wyzwalające odtwarzanie epizodów, płyną z najwyższego szczebla CE w asocjacji z innymi pojęciami, być może wzbudzanymi w innych ośrodkach. Może to być ośrodek przetwarzający inne funkcje modalne, przykładowo, ośrodek słuchu i rozpoznawania mowy, gdzie na dźwięk słów „piękne wakacje”, pobudzane są struktury pamięci semantycznej, które poprzez połączenia wewnętrzne poziome a następnie zstępujące, mają możliwość przesłania sygnału pobudzenia do pamięci epizodycznej. Na podobnej zasadzie, przywoływane mogą być jeszcze większe subtelności obrazów tworzących epizody w naszej pamięci, które nazywać można subepizodami. Nie możemy mieć pewności, że te subepizody, to na pewno fragmenty przywołanego epizodu. Mogą zostać pobudzone subepizody z całkiem innej bajki, byle tylko pasowały do naszych wspomnień a nasz CE zaakceptował i „zrozumiał” całość. Jeśli zarejestrowaliśmy w naszej pamięci krzyki mew, to fragmenty tego epizodu mogą wystąpić jako subepizody w całkiem innych odtworzeniach epizodycznych.

Subepizody mogą być pobudzane poprzez połączenie descedentne oznaczone na rys. 1 literami Ak , Bk , Ck, i.t.d., gdzie kolejne litery ABC…, oznaczają modalność zmysłową a indeks k oznacza poziom analizy wzorca. Poziom ten może być skorelowany ze stopniem szczegółowości sceny. Powstaje zasadne pytanie jak wybierać poziom k ? Rozważyć należy dwie hipotetyczne możliwości. Pierwsza polega na tym, że jednocześnie pobudzane są wszystkie poziomy hierarchii. Wówczas o szczegółowości obrazu docierającego na poziom świadomości decydować będzie selekcja wzorca poprzez mechanizm konkurencji, (równoważny mechanizmowi przełączania uwagi, jak w pracy [Starzyk, 2011] ). Druga możliwość, to wybranie poziomu k poprzez jego przywiązanie k-tej ścieżki descedentnej, do odpowiadającej jej ścieżki ascedentnej jak to przedstawiono powyżej. Związek taki musi być utrwalony w pamięci trwałej i powstać może w wyniku procesu uczenia, czyli zapamiętywania zdarzenia. W realnych mózgach zwierząt, być może oba mechanizmy występują równocześnie. Obecny stan rozumienia procesów neuronowych i roli astrocytów w procesach myślenia nie pozwala na określenie sposobów współdziałania pamięci asocjacyjnej z pamięcią trwałą oraz ich relacji do pamięci epizodycznej.

Widzimy więc, że opisana organizacja odtwarzania epizodów o rożnym stopniu szczegółowości stwarza zmienne zapotrzebowanie na pamięć roboczą, w której to się odbywa. Zresztą mózg broni się przed nadmiernym obciążeniem. Rzadko przypominane epizody stopniowo zapominamy (za wyjątkiem fragmentów często odtwarzanych jako subepizody) i zwykle po pewnym czasie pamiętamy nieruchome sceny, a porusza je tylko wyobraźnia lub narracja werbalna. W końcu i te wspomnienia ulatują z naszej pamięci, jeśli ich nie odnawiamy.

Mechanizm zapominania jest równie istotny jak mechanizm zapamiętywania epizodów. Pamięć epizodyczna krótkotrwała obszarów sensorowych absorbowana jest nieustannie ogromną ilością sygnałów. Mechanizmy konkurencji i hamowania selekcjonują jedynie nieliczne z nich do przetwarzania i zapamiętywania w pamięci epizodycznej trwałej. Pamięć robocza musi być nieustannie opróżniana aby umożliwić przyjmowanie nowych bodźców. Także pamięć asocjacyjna może być udostępniona do dalszych operacji po utrwaleniu informacji w pamięci trwałej. Ponieważ jednym z czynników decydujących o zapamiętaniu trwałym jest powtarzanie bodźców w okresach czasu, więc pamięć asocjacyjna musi zapamiętywać informacje choćby na takie okresy. Wybór czasu zapamiętywania informacji w pamięci trwałej zależy od strategii życia ucieleśnionej inteligencji. Przy ograniczonych zasobach pamięci korzystne może być zapominanie informacji niewykorzystywanych w bardzo długich okresach czasu. Strategię zapominania, którą zwierzęta wykształciły ewolucyjnie, ustalić musimy w drodze analizy ekonomicznej.

5. Komunikacja z siecią kognitywną

Jednakże rozpoznanie tych niezwykłych właściwości będzie niemożliwe bez wykształcenia języka wspólnej komunikacji. Podobne trudności występują w wykryciu i określeniu stopnia świadomości i inteligencji u istot żywych. Trwają niekończące się dyskusje nad samoświadomością małp, delfinów, słoni, psów, kotów i innych zwierząt, choć posiadają one podobne do ludzkich zachowania społeczne i podobny język ciała, reakcje somatyczne a nawet mimikę, co teoretycznie powinno ułatwić przeprowadzenie stosownych eksperymentów. Można tylko wyobrażać sobie, jakie trudności komunikacyjne powstać mogą w przypadku kontaktu z istotą nie przypominającą niczego, co do tej pory widzieliśmy, jeśli istota taka we wspólny język nie zostanie uprzednio wyposażona.

Wydaje się, że współczesny poziom technologii analizy i syntezy mowy stwarza możliwość wyposażenia sieci neuronowej w zdolność rozpoznawania mowy i jej świadomego generowania w celu komunikacji z obcymi podmiotami. Odbywać się to musi w procesie uczenia. Zdolność sieci do rozpoznawania i kategoryzacji obiektów wykorzystywana być musi równolegle w dwóch modalnościach. Następować musi prezentacja obiektów i równoczesne ich słowne nazywanie. Rozpoznane na poziomach funkcji kognitywnych reprezentacje mentalne obiektów i ich nazw przekazywane będą jednocześnie do CE, gdzie utworzą wspólny wzorzec odpowiadający powtarzającej się nowej konfiguracji pobudzeń. Podobna sytuacja, powtarzania sekwencji słów towarzyszących operacjom na oglądanych obiektach, wytworzyć może wzorce odpowiadające związkom syntaktycznym pomiędzy słowami. Jeśli te zestawienia symboli wyrażone w sekwencjach fonemów doprowadzimy do generatora mowy, to umożliwimy sieci wypowiadanie własnych myśli. Powstanie w ten sposób nowy język symboliczny odzwierciedlający procesy mentalne wewnątrz sieci.

Operowanie złożonym językiem symbolicznym umożliwi formułowanie pojęć wysoce abstrakcyjnych, o większym stopniu ogólności. Wymaga to świadomego operowania zdaniami tego języka, które to zdania też stanowią epizody zapisane w pamięci epizodycznej ośrodka mowy. Uruchamianie tych epizodów słownych następować może dzięki pobudzaniu struktur wejściowych ośrodka mowy poprzez sygnały docierające z CE na podstawie skojarzeń z pojęciami przetwarzanymi w strukturach CE. Możliwe jest także świadome kierowanie uwagi dzięki formułowanym zdaniom lub według zwerbalizowanego rozumowania logicznego. Wówczas epizody słowne w postaci zdań, doprowadzone będą do CE i ewentualnie sumowane z symbolami logicznymi lub dodatkowymi motywacjami emocjonalnymi (jak ambicja, upór, strach itp.) zmuszać będą „ciekawość” do poszukiwania złożonych konfiguracji kojarzonych z pojęciami narzuconymi przez ośrodek mowy. W ten sposób demonstrować się będzie świadome zaspokajanie ciekawości, co prowadzić będzie do świadomych działań poznawczych.

6. Komunikacja wewnętrzna – język stanów mentalnych.

Wiedza zewnętrzna w postaci symbolicznej musi być tłumaczona na język pobudzeń nerwowych. Język konfiguracji pobudzeń jest swoisty dla każdej sieci, ponieważ jest efektem doświadczeń: zbioru doświadczeń, a nawet kolejności ich zdobywania. Ponadto, naturalne sieci neuronowe mają niepowtarzalny układ połączeń neuronowych. Wobec czego każda sieć inaczej dekonstruuje obraz lub epizod i inaczej go przetwarza w warstwach pośrednich. W konsekwencji nie ma jednoznacznego systemu rozpoznawania i kategoryzacji pojęć przez sieć. Każda sieć wytworzy własny język konfiguracji mentalnych, co przy dużym stopniu złożoności sieci i indywidualnym toku zdobywania doświadczeń, samouczenia i uczenia uniemożliwi poznanie tego języka.

Dlatego nie da się dokonać tłumaczenia automatycznego wiedzy zewnętrznej, encyklopedycznej. Może ona być przetłumaczona w procesie przedstawienia tej wiedzy zmysłom. Musi być ona „przeżyta” przez system, powiązana z wcześniejszymi doświadczeniami. Proces tego tłumaczenia będzie więc tożsamy z procesem uczenia umysłu ludzkiego. Mimo sztucznego charakteru sieci i pozornie łatwego dostępu do jej stanów mentalnych, proces uczenia będzie równie mozolny. Szczególnie tłumaczenie nowych, złożonych pojęć będzie wymagało indywidualnego podejścia i cierpliwości w znalezieniu formy dostępnej dla każdej indywidualnej sieci. Brak wspólnego wewnętrznego języka uniemożliwi zatem bytom świata zewnętrznego komunikowanie się tym językiem. Natomiast nie ma przeszkód, aby sieci wytworzyły wspólny język symboliczny, w którym będą mogły opisywać swoje stany mentalne, tak, jak to się dzieje między ludźmi. W języku tym będą się mogły porozumiewać, uzgadniać wspólne działanie, wspólnie i wzajemnie się uczyć czyli oddziaływać społecznie.

Indywidualny język konfiguracji stanów mentalnych stanowi więc barierę przed ingerencją w ludzką osobowość. Każdy umysł posiadający świadomość, będzie zmuszony do zbudowania własnego modelu świata i własnego światopoglądu, zgodnego z jego doświadczeniami zdobytymi w toku doświadczeń osobistych, w toku nauczania i samouczenia poprzez przemyślenia, rozważania oraz wewnętrzną, zwerbalizowaną dyskusję.

Nawet kopiowanie poprzez seryjne wytwarzanie sztucznych sieci neuronowych, wypełnionych wiedzą wstępną, nie zagwarantuje powielania tożsamej osobowości, ponieważ inteligentne jednostki, natychmiast po rozpoczęciu niezależnego „życia”, zaczną gromadzić zróżnicowane doświadczenia i inaczej je kategoryzować. Natomiast niezawodność i szybkość przetwarzania maszynowej pamięci, brak ograniczeń w rozroście pamięci i rozbudowie poziomów uogólniania wiedzy, doprowadzić może do uzyskania znacznie wyższej inteligencji i poziomu samoświadomości sieci sztucznych w porównaniu z mózgami ludzkimi.

7. Wnioski

Zaproponowania architektura kognitywnej sieci neuronowej posiadać będzie zdolność kategoryzacji rozpoznawanych obiektów, zapamiętywania i przypominania sobie epizodów ze swojego życia, ze swojej przeszłości, logiczne myślenie i rozumienie docierających zdarzeń. Co najważniejsze sieć posiadać będzie motywację do działania, do aktywnej dbałości o komfort funkcjonowania oraz do zdobywania i gromadzenia wiedzy na skutek działania mechanizmu ciekawości. Możliwość inteligentnego działania ukoronowana będzie samoświadomością i wieloma wyższymi funkcjami psychicznymi. Te spektakularne efekty wynikają z właściwości rozpoznawania i kategoryzacji przez sieć o strukturze koneksjonistycznej, ze zdolności zapamiętywania swych przeżyć, wrażeń, doświadczeń w pamięci epizodycznej oraz z możliwości wielokrotnego docierania do tych zapamiętanych epizodów. Wydaje się, że te niezwykłe zdolności można wspaniale wykorzystać uzupełniając je o olbrzymie zasoby wiedzy symbolicznej, które zgromadziła ludzkość w dostępnych bazach danych.

Jednakże sprawa nie jest tak łatwa, jak mogłoby się wydawać. Sieci o architekturze symbolicznej mają zdolność do ekspresji słów i pojęć zawartych w ich pamięci. Jednakże dokonują one jak gdyby odczytania zawartości pamięci. Wiadomo, że człowiek także może dokonać odczytania tekstu. Ze zrozumieniem, lub bez zrozumienia, jedynie mechanicznie wypowiadając słowa na które patrzy. Mózg ludzki, dysponując architekturą koneksjonistyczną, ma natomiast możliwość w dowolnym momencie włączenia mechanizmu rozpoznania czytanych słów i ich zrozumienia. Możliwości takiej pozbawiona jest sieć o architekturze symbolicznej. Po prostu słowa-symbole nie są w niej przetwarzane na jedynie zrozumiały dla niej język pobudzeń konfiguracji neuronów. Pamięć asocjacyjna nie ma wówczas wzorców do korelacji. Do bloku „Self” nie jest wysyłany sygnał zrozumienia. Nie ma samoświadomości.

Przykład mózgu ludzkiego dowodzi, że możliwe jest funkcjonowanie architektury hybrydowej. Po prostu warstwa symboliczna poddawana jest analizie przez sieć kognitywną, a dalsze operacje wykonywane są na reprezentacjach mentalnych tych sygnałów. Możemy to z łatwością powtórzyć w mózgach sztucznych. Jednakże nie uzyskamy w ten sposób swobody powielania software, w sposób, w jaki zaopatrujemy w informacje algorytmiczne bazy danych. Dzieje się tak dlatego, że nie potrafimy przewidzieć sposobu, w jaki każda indywidualna sieć koneksjonistyczna kategoryzuje informacje. Przy dużej liczbie elementów, może to być proces chaotyczny a wyniki niepowtarzalne. Ponadto funkcje kategoryzacji nawet w identycznych sieciach, zależne będą od wcześniejszych doświadczeń. Dlatego proces „tłumaczenia” wiedzy symbolicznej do języka wewnętrznych stanów mentalnych następować musi w procesie żmudnego uczenia każdego osobnika. Efekty tego uczenia mogą być różne w zależności od „zdolności” indywidualnych sieci i od motywacji, czyli hierarchii „wyznawanych wartości”. W ten sposób przekonujemy się, że każda sztuczna sieć posiadać będzie unikatową indywidualność. W każdym przypadku będziemy mieć do czynienia z indywidualną Osobą.

References

  1. Duch W. (2010) Architektury kognitywne. Neurocybernetyka teoretyczna, Rozdz. 14, pp. 329-361, ed. R. Tadeusiewicz.,
  2. Galus W.L. (2011) Machine Mind, International Journal of Machine Consciousness (in press)
  3. Baddeley A.(2000) The episodic buffer in working memory, Trends in Cognitive Sciences, Vol. 4, No. 11,
  4. Starzyk J.A., Graham J.T. Raif P., Tan A-H., (2011). Motivated Learning for the Development of Autonomous Systems, Cognitive Science Research (w druku).
  5. Starzyk J.A., Prasad D.K. (2011) A Computational Model of Machin Consciousness, International Journal of Machine Consciousness (w druku).
  6. Starzyk J.A. (2011) Mental Saccades in Control of Cognitive Process (w druku)
  7. Edelman G.M., (1992) Bright Air, Brilliant Fire, On the matter of the Mind (1999), tłum. Przenikliwe powietrze, jasny ogień. O materii umysłu. Warszawa: PIW 1999.
  8. Nuxoll, A.M., & Laird, J.E. (2007). Extending cognitive architecture with episodic memory. In Proceedings of the twenty-second AAAI conference on artificial intelligence. Vancouver, BC.
03/03/2011

Machine Mind

- autor: Wieslaw Galus

Preprint of an article submitted for consideration in International Journal of Machine Consciousness © 2011   copyright World Scientific Publishing Company http://www.worldscinet.com/ijmc/ijmc.shtml

Polska wersja:  http://mindconsciousness.wordpress.com/2011/01/09/samoswiadomosc-maszyn/

Eutherm Ltd, Poznanska 129/133,
Ozarow Mazowiecki, 05-850 Poland
w.galus@eutherm.eu

Received Day Month Year
Revised Day Month Year

Abstract:

This paper points out the purposefulness and possibility of constructing thinking machines that possess self-consciousness. It indicates that these machines will have curiosity and the ability to understand performed actions, an ability to communicate with a natural language, desire to acquire knowledge of the world and an ability of self-identification and sense of distinctiveness. The material base of these processes is indicated, i.e. neural mechanisms ensuring that these properties are present in the brains of some animals. A desired architecture of artificial cognitive neural networks to achieve these properties is presented.

Keywords: self-consciousness; cognitive architectures; curiosity; machine reasoning; understanding; self-awarness;


1.   The meaning of self-consciousness

The aim of these considerations is to show that self-consciousness is an important and desirable property of each intelligent cognitive neural network. This concerns both live minds and artificial cognitive neural networks. Self-consciousness, defined as the ability to separate and identify self, confers an evolutionary advantage on intelligent animals through enhancing their adaptiveness, plasticity and the potential to further increase their intelligence. Apart from bearing on species development, this also affects ontogenetic development.

 

The idea of equipping an artificial intelligence with self-consciousness raises controversy. Dangers associated with it and ethical problems that may arise are pointed out. However, acknowledging the effectiveness of solutions offered by evolution, it should be noted that developing an artificial intelligence that surpasses human intelligence will be possible thanks to endowing an artificial brain with motivation to enhance its intelligence through the need for cognition, which can be either unconscious (in the case of automatic, instinctive processes) or conscious. This, in turn, implies equipping them with self-consciousness.

 

It should be noted that “the need for cognitive activity and exploration of the environment” exhausts the features of the phenomenon of “curiosity”. This implies that equipping a cognitive system with “curiosity” is a prerequisite for them to gain self-consciousness, which means constructing a model of reality and understanding the position of self in this reality.

 

2.   The meaning of “curiosity”

In the animal world there exist several degrees of consciousness, or rather a continuum of consciousness states and intelligent behaviours, from the most primitive ones to the human psychology. They are all accompanied with a certain degree of curiosity. We can observe a strong correlation between the degree of “curiosity” and the degree of consciousness.

 

In the living world curiosity is seeking an alternative way, a different, better solution to a problem. An overpowering desire to check what is behind a turning, a barrier, an obstacle? Generally, this is the need for cognition. Its essence is intentional work of a mind, which searches for new sensory perceptions, or exploration of the internal models of reality that are recalled from the permanent memory, in order to constantly expand the database of subsequent analyses, new categorisations and new comparisons of these models. This is exactly what our computers are not capable of. Their “curiosity” is castrated by programmers. We do not demand our machines to constantly ask questions “what the hell is it?”, as we expect from them the most effective numerical performance, prompt solution finding, or in general, narrowly understood economy of operation. We create machines that are slaves. However, lack of freedom does not promote thinking.

 

An animal mind follows any new information that is associated with previously acquired models of reality, and especially with models that are currently being analysed. This concerns penetration of areas neighbouring in space and in time, in which an intelligent entity moves, in the broadest sense of these words. The curiosity associated with observed objects, images, impressions and their mental representations recalled from the memory corresponds to the perceptual curiosity [Berlyne, 1954] or physical curiosity [Dewey, 2007]. It is mostly not consciously controlled, it operates automatically and somewhat chaotically.

 

In the case of the human mind there is also a linguistic consciousness, which allows to formulate verbalised questions about the phenomena perceived in the environment and their models. This is associated with a conscious curiosity, i.e. verbally formulated intellectual need for cognition. This notion of curiosity corresponds to the “epistemic curiosity”, according to the classification by Berlyne, or to the “intellectual curiosity”, according to Dewey. As mentioned earlier, consciousness is gradable and its increase is correlated with development of a communication language and cognitive abilities, which are in turn driven by “curiosity”.

 

It is obvious and follows clearly from research on the behaviour of animals and humans how fundamental the meaning of “curiosity” is in the ontogenetic and phylogenetic development. Curiosity stimulates individual activity and determines expansion in the environment and the ability to explore it, which increase or decrease survival chances of the whole species. But how is it achieved!? What is the material basis of curiosity? These are the questions that must be answered in order to understand how curiosity arises.

3.   Visual consciousness, recognition of images

In the light of recent studies, the astonishing hypothesis by Crick [1994], stating that mental processes are products of the brain, can be further elaborated on, bearing in mind that the animal brain is built from neurons and astrocytes, which are connected with other astrocytes and with receptors and effectors through neurons. One can make a simplified assumption that astrocytes and synapses record chemical traces of brain activity, and electrical stimuli are conducted between astrocytes mainly with neurons. This classification of astrocyte and neuron function suggests that the long-term memory is linked to chemical states of astrocytes and neural synapses possibly controlled by them, whereas information processing and the short-term memory is linked to their electrical states and the states of electrochemical excitation of neurons.

 

The ability of logical processing in the brain is achieved not through complex operation programmes of astrocytes or neurons, but mainly through an appropriate structure of numerous connections between relatively simple elements. As they affect the operation of neurons and enhancement or inhibition of synaptic connections, astrocytes may adjust the structure of connections to current tasks and previously gathered experience. As a result, the structure of connections in the system is modified by the chemical states of astrocytes, and hence it is in the network of the system, as a whole, where memory resides.

 

The structure of neural connections and of the brain allows to identify specialised fields and areas, where the signals reaching them are processed. The hierarchical functional structure is reflected in the stratified structure of the cerebral cortex and in the order of information transmission to successive brain areas that are responsible for its different functions, which are termed processing areas. On their lower levels, located close to receptors, they form maps, which to some extent reflects the spatial structure of stimuli, and for this reason are called retinotopic maps. It can also be assumed that there is gradual progression from areas processing simple image elements to percepts that represent complex patterns of the environment, and from general concepts and events to those that focus on unique objects and events. Integration of percepts delivered by receptor fields is believed to take place in fields or maps ordered in the processing hierarchy that represent the excitation states of lower layers of neural cells. This mechanism is in accordance with the hypothesis by Damasio, later picked and presented in detail by Crick, and today accepted by majority of researchers and used in its simplified form in neural cognitive networks for object recognition.

 

It is easy to imagine that this process of visual perception and image recognition through electrical excitation of neural cells, neurons and astrocytes, will leave memory traces, both chemical traces in astrocytes as well as changes in the neural connections structure, through an effect on synapses. While states of electrical excitation of cells can be identified with the short-term memory, the memory traces referred to above are responsible for the long-term episodic and semantic memory.

 

It should be noted that on the higher levels, which process information, nothing is created that could reflect the image observed by the eye and projected onto the retina. This is achieved, simply, through excitation of neural cells representing the generalised symbols of the perceived object features. In this manner, the mind records the fact of recognition of an image’s components. They are identified by the specific configurations of excited cells which recognise more basic features. Neural cells of all hierarchy levels in visual fields do not attach much importance to where in the visual field the feature that excites them is present. Nevertheless, the symbolic representation of the observed reality that arises in the brain has perfect spatial organisation, which allow creation of the complete, three-dimensional image of this reality.

 

In order to ensure the presence of useful to survival mental correlates of the observed images, percepts of gradually higher generalisation order are directed to the higher maps and processing fields. A “tree” of ascending excitations is thus formed. An impulse is transmitted towards the stem of this symbolic tree, to successively higher hierarchical levels. As a consequence of comparison and generalisation, information is substantially compressed.

 

To obtain a complete picture of the environment in which an animal moves, it is necessary that images of the currently observed scene are associated with the images of places that are close in space or time. Recalling them requires that backward signals are sent to maps or fields down in the hierarchy (perhaps of topographic structure), which excite cells responsible for the formation of these images in the moment of their observation. Their excitation will lead to the creation of the same visual image from the past, which is processed at the same time with the currently observed image, making it possible to compare these images (associations), search for (selection) common elements (correlations), generalise, categorise and perform other advanced processing operations. Transmission of these impulses down the hierarchy, to the levels close to receptor fields, forms a corresponding tree of descending impulses. Through reciprocal excitation of the cells that store the configurations of neuron excitations that are mental correlates of an environment image and of the images from fields that are close in space or time, the mind is able to compare the patterns of images transmitted from this level, create a model of the environment and determine its own position in it.

 

But what is the mechanism that forces the mind to penetrate memory, to explore all cognitive resources, to constantly stimulate other cells of lower fields in order to generate impressions associated with the currently analysed information coming from the sensory fields? As will be shown later, this mechanism is just “Curiosity”.

 

4.     Consciousness – recognition of mental states

 

If we accept this hypothetical pattern of image formation and recognition, why not extend this pattern to the formation of ideas and models that are even more generalised? Application of mechanisms of mental representations of sensory impressions to recognition of a mental state of the mind enables formation of complex groups of excitations, generated in the lower layers and cortex areas, which produce patterns of reality when transmitted upward. Similar patterns, created in other brain centres, which are responsible for specialist linguistic, logical, geometrical, etc. functions may interfere at any configuration. They mutually interact through comparison and formation of correlations, whose strength determines further propagation of the wave of excitation of neural cells in successive, higher fields. This corresponds to the relational model developed by Taylor and global-workspace proposed by Baars [Baars at all., 1998].

 

According to this model:

 

At any one time, different sensory inputs, including such ‘inner’ inputs as visual imagery and inner speech, compete for access to consciousness. Other possible inputs include abstract conscious content such as beliefs and ideas. The material selected to be conscious involves both top-down influences and bottom-up inputs. … . Thus conscious content reflects an endless interplay of competition and cooperation between possible inputs and top-down influences.”

 

A drawback of this model was that it did not specify the source and cause of these ‘inner’ inputs and impulses generating also above mentioned abstract inputs. Extrapolation of the image recognition method described in the section above, indicates, why the mind is flooded with a stream of information on alternative patterns and models of the analysed reality.

In the similar manner, by the pattern competition and selection, more complex mental states, that correspond to the concepts that form a holistic model of the environment, can be recognised. Given the broad knowledge stored in memory, in the course of the learning process new complex models of the world will be created. Generated will be mental correlates of abstract notions, such as symmetry, beauty, sense of familiarity with an object and also emotional states, such as fear, good, evil or love. Conscious models of the world that employ these notions allow to form an outlook on the world.

 

In the brains of living organisms, new types of recognised impressions are accompanied not only by creation of new structures able to remember them, but also by formation of new connections between the cells that are in any way related to the structures in which these impressions are stored. Theses connections may be created through spatial proximity, as generalised impressions are placed in the vicinity of structures that specialise in similar “issues”. This is a way of formation of fields containing “problem maps”, which are processed by the brain and correspond to those created for processing of visual signals and recognition of images. (The localness hypothesis). Animal brains evolved in the direction that enables them to find the most valid interpretation of the received stimuli and of the data stored in their memory, with the simplest measures available at hand. Using spatial proximity seems a very simple but at the same time effective means. The proximity of fields responsible for recognition of complex notions is crucial for their association, thanks to them being easily excited by calcium ions waves generated by astrocytes, which are the basic means of astrocyte’s communication with practically all neighbouring astrocytes.

 

The mind constantly seeks patterns in which the excitation states of lower layer cells show similarity to the configurations of stimuli that are currently generated by sensory inputs or by the imagination, stimulated by the curiosity mechanism. This means constant search of similarities. The group of stimuli has to be assigned to something. This is also a manifestation of curiosity. An object that is not assigned to anything draws attention of the mind. The senses try to obtain more information on it. For example, shadows looming in a dark forest must be recognised as trees, bushes or animals. Until this recognition takes place, we try to examine them and acquire information on them with all available senses, and to understand the meaning of this information.

 

If these are internal stimuli, generated by lower brain fields, also the mind tries to assign a familiar form to them. For this reason, we recognise elements of the world seen in dreams, although they are far from reality. On a higher level of abstraction, when our thinking touches on general ideas, assigning these ideas to some model explaining a given phenomenon allows to collate complex theoretical and logical constructions, which combine to form whole areas of knowledge, containing description of complex natural phenomena. The drive to constantly update the database of impressions, ideas and models necessary for a complete description of reality, in accordance with observed facts, is the driving force of science development.

 

Finally, transmission of compatibility signals of descriptions touching on different aspects of a phenomenon provides a sense of understanding. Until we reach this sense of understanding, our mind concentrates on this task. It can be assumed that the sense of understanding is also recorded in the relevant centre of understanding, which gathers the neural cells of “understanding”, just as “grandmother cells” known from the descriptions of our vision and the ability to recognise human faces. Having models of reality that provide the feeling of understanding our own position in the environment and our own autonomy, we create a new set of excitations of the highest level cells, which corresponds to the impression of consciousness. Obviously this impression can also be stored, in a “consciousness cell”, whose excitation state in a given time will remind us that we are conscious. The freedom to choose such a moment and remembering the fact that we already received this signal once will be recorded as “the permanence of existence” and of course will be stored in the “permanence of existence” cell. Is this chain endless? For us humans the chain of abstract generalisations is probably close to an end. However, for beings brighter than us, who are equipped with greater intellectual potential, higher states of contemplation of the world are possible. The sense of “unity with the world”, “nirvana”, etc.

 

The existence of the “self-consciousness sense” cells has nothing to do with the state of consciousness, which is an emergent feature of the whole brain and does not have any specific localisation.

 

Curiosity constantly provides the mind with new patterns and the mind has a need to compare and associate them. This need to associate new patterns with patterns stored in the memory is an immanent property of the mind. The mind cannot function if it cannot reach the state of compatibility, meaning the sate of understanding the patterns of reality that it creates. In order to reach this state, the mind is capable of incurring all cognitive effort possible. If, however, this effort is not or cannot be effective, the mind feels discomfort, concern, fear, or in extreme cases panic and other negative emotions. If agreement of patterns and understanding is achieved, the mind feels positive emotions.

 

If the mind is able to comprehend that full understanding of reality is not possible, it tries to create an explanation in the form of a “complementary model” of reality, which surfaces as an escape to mysticism, to fictitious knowledge. This leads to beliefs and superstitions.

 

A prolonged state of lack of understanding of the received patterns and accompanying chronic fear leads to a range of psychological disorders and pathological states known in psychology and psychiatry.

 

Thus, the need for understanding is the most fundamental instinct of the conscious mind. It should be mentioned that for a conscious mind, the necessity to understand is the highest right. It is simply defined by it.

 

5.    Artificial consciousness

 

What processes of transmission of information between brain structures accompany these phenomena? Are we able to construct an electronic model of the brain, which shows curiosity, consciousness and other mental states typical of the brains of living creatures?

 

Research on artificial intelligence has enjoyed staggering success. Several machines have been constructed, performing tasks for which a human uses intelligence. Significant progress was made in the development of artificial vision and image recognition systems. Devices for reading, human speech generation and translation between various languages have been constructed (although their quality is so far unsatisfactory). Expert systems diagnose more accurately than teams of human specialists. Machines controlled by an artificial intelligence perform complex missions on their own, not requiring constant, direct assistance from a human.

 

In the recent years, significant progress in imitating processes taking place in the minds of living creatures was made in the area of cognitive neural networks. The architecture of these networks largely resembles, or rather intentionally imitates the structure of the brain. Networks have layers, the lower ones being linked through receptors to the higher ones. They are capable of transmitting matrices of stimuli representing mental states up the hierarchy, from the fields linked to receptors to the higher processing levels. They are determined by matrices which determine inhibition or transmission states of synapses, stored in the permanent memory. Information on the received impressions, transmitted in this way to the higher levels, form a tree structure, which corresponds to the hierarchical organisation of mental patterns. The greatest hopes for a future success are provided by networks with emergent or hybrid architecture.

 

These networks are learnt to recognise patterns of objects, images and symbols through the “supervised learning” or the “reinforcement learning” method. However, up to now we have failed to equip these complex machines with self-consciousness.

6.    The hypothesis on the indispensability of the curiosity instinct for achieving self-consciousness

 

In the chapter on the meaning of curiosity I pointed out curiosity as a property that artificial neural networks and algorithmic computers usually lack.

Now I present a hypothesis stating that acquiring consciousness is a natural process if we acknowledge the role of the “curiosity” instinct, which creates internal motivation to employ cognitive functions. An artificial brain should be equipped with a mechanism of penetration of memory resources, called the mechanism of “curiosity”. It should be able to follow all associations in its own memory, to go beyond the area in which it was trained and beyond the problem field that is currently analysed, and reach for new tasks which it formulates to itself.

 

In the brain of an animal there are three underlying mechanisms of the “curiosity” function.

  • The first one is a mechanism of exploration of memory resources through transmission backward excitation waves to the lower structures that are closer to sensory fields. One source of these backward signals may be groups of cells representing consciously and unconsciously excited patterns.

  • A second source is an automatic mechanism of excitation of neighbouring cells, especially of astrocytes containing permanently stored information. It will lead to a kind of diffusion of stimuli reaching a certain group of cells, in which memory about the associated group of objects, ideas, events, etc. is stored. The hypothesis on the spatial correlation of impressions and ideas of common nature should be recalled here.

  • The third mechanism is long-term excitation of cells storing information that is in some way associated with the problem in question. This association implies the existence of previously formed pathways of information transmission between these structures. These routes may be created in the process of learning and network development, and also as a result of behavioural experiences or mental experiments, impressions, etc. Excited in this manner, distant cells, including astrocytes, may become sources of new, spontaneous waves of impulses sent to neighbouring astrocytes, therefore triggering the creation of new, even the most surprising associations.

 

These mechanisms stem from the morphology of the brain and the properties of neural cells: astrocytes and neurons. They are permanent, innate processes, and can therefore be called “an instinct of curiosity”. The operation of the first mechanism may be effectively controlled through conscious processes. The remaining mechanisms may operate beyond consciousness. The effects of these mechanisms, related to the mechanism of competition and neural inhibition, are equivalent to the mechanism of “attention”, previously proposed by other researchers.

 

The creators of the cognitive neural networks constructed up to now realised long ago that their systems should perceive the “sense of existence” or “the purpose of life”. For this reason, they tried to apply various types of motivation to force networks to action. Most often, these were tasks that were imposed “by a superior”. Attempts were made to formulate the so-called “values” which systems would use as guidance. Attempts were also made to optimise a selected parameter, which could be the so-called “artificial pain”.

 

It was further attempted to create “curiosity” through enforcing cognitive behaviours involving exploration of an area or examining new objects. “Curiosity” thus incited had artificial nature, not related to neural mechanisms of memory penetration and obtaining patterns for comparison. In the work by P.Y. Quedeyer [Quedeyer et all., 2007] it is discussed whether exploration of the environment can be triggered by self-learning, motivated by maximisation of the possessed knowledge, which is termed “curiosity” by the authors. It is therefore an artificial curiosity. A more complex system of internal motivation has been presented by the team of J.A. Starzyk [Starzyk at all., 2010], which postulated a mechanism of multi-level instinct of pain avoidance, leading to more sophisticated and abstract motivation that forces the system to action. Complementary to this mechanism is introduction of a certain non-removable level of pain, which forces activity, exploration of the environment, when the main sources of “existential pain” are neutralised. This mechanism, through forcing exploratory and cognitive behaviours, plays the role of curiosity. Selection of the dominant motivation is done by the Central Executive [Starzyk & Prasad, 2011], which controls the mechanism of competence and inhibition of processes that are not given priority. However, an artificial curiosity created in this manner remains a curiosity of the external world. It cannot be a mechanism of supply of reality patterns from a set of stored experiences.

 

Pain is a strong stimulus and fear of pain, related to the self-survival instinct, has been discussed several times as a strong motivational factor, much more important than curiosity. It seems that both mechanisms, curiosity and the instinct to “avoid pain” are competitive. However, it can be noted that both instincts exhibit enormous similarities:

  1. Both of them are natural for living organisms and sufficiently strong to determine species and individual survival.

  2. Both of them are products of evolution.

  3. For both of them neural mechanisms of their development can be indicated.

  4. Both of them can be generated by external and internal neural excitation.

It should be concluded that de facto, they are at opposite poles of the same phenomenon. Living creatures commonly show curiosity, which, however, is restrained by fear. Meaning, of course the fear of pain (i.e. of any discomfort). I agree with researchers that pain refers to intelligence, i.e. more primitive behaviours. There may exist intelligent behaviours without self-consciousness. Curiosity, in turn, refers to the shaping of self-consciousness, i.e. the sense distinctive of the most developed creatures. However, is Curiosity, or a need for exploration of the environment, not evolutionarily younger? It results from a need to satisfy hunger and sexual desires, or even from fundamental evolutionary principles, such as species expansion. It should be assumed that both of these motivations should act simultaneously, the instinct of pain avoidance – to force activity and maintain safety, and curiosity – in order to achieve higher states of consciousness.

 

Implementation of the “curiosity” mechanisms in an artificial brain allows to transform it into a conscious mind. However, it is not directly curiosity that may be an effective factor motivating to action. This can be reached through formulating a purpose function, i.e. through the motivation to act being the function of the agreement of reality patterns reaching their comparison centre. The agreement of the patterns of the environment, models of the world and phenomena means a sense of understanding. This is how an artificial cognitive network is made subject to the “Principle of Necessity to Understand”.

 

In the proposed solution motivation is a natural parameter which is a function of a correlation during pattern recognition and comparison, which means agreement of the compared patterns of reality, which in turn means, in the language of subjective mental notions, understanding. Examining the operation of the Principle of the Necessity to Understand on the example of the human brain, it can be postulated that a human brain possesses, and an artificial cognitive neural network should possess an integrated mechanism of seeking a maximum of functions of correlations of excitation states of the cells that form these patterns. This “value” is sufficient to generate a complexity of conscious behaviours.

 

In order to use the potential present in this motivation, the brain should not experience memory limitations that prevent it from memorising generalised ideas and patterns of reality. Furthermore, as we know, the system should be equipped in the above curiosity mechanisms. Thus, a real understanding, resulting from a real curiosity, will arise.

 

One can therefore attempt to define a desired architecture of a cognitive neural network:

  1. It should be a connectionist architecture with a hierarchical structure, of the emergent or hybrid type, divided into fields, maps and specialist functions centres.

  2. It should have memory of sufficient capacity and an extensive hierarchy of processing fields or, possibly, dynamic creation of “astrocytes”*.

  3. It should be a network with separated functions of operational, episodic, volatile (i.e. neural) and long-term memory, addressed to separate cells, called astrocytes.

  4. This network should enable transmission of long-distance impulses through neural connections in ascending and descending tree structures. It should possess a mechanism of backward inhibitory signals propagation for selection of privileged configurations of mental states. This mechanism will determine rules of grouping impulses, necessary for logical operations performed by the network.

  5. The mechanism discussed in point 4 should lead to creation of reality patterns that are compared in a specialised centre.

  6. The network should have specific motivation, provided by maximisation of the function of correlation of the compared patterns which corresponds to the principle of necessity of understanding.

  7. The network should enable spontaneous diffusion of the state of excitation of neighbouring “astrocytes”.

  8. It should have a mechanism of memorising impressions of similar character in “astrocytes” that are close in space. (localness mechanism)

  9. It should also possess a mechanism of enhancing and remembering transmission routes of frequently used signals, correlated with a mechanism of grouping transmitted configurations of excitations.

  10. The excited cells should generate excitation signals back to lower levels of the hierarchy and to other specialised processing centres.

 

* – astrocytes means long-term memory cells.

 

These requirements are far from the cognitive networks architectures used today. However, their technical implementation should not present a fundamental difficulty. A network designed in this way will be able to create temporary models of the environment, through projecting them on the configuration of mental states. Reaching agreement of configurations of neural impulses that are representation of these models allows to generate a state of “understanding” and a sense of self-consciousness, similarly as in the case of the minds of living creatures.

 

Therefore, the functioning of the curiosity instinct, through the principle of the necessity to understand is defined by the self-consciousness of the mind. The proposed motivational mechanism, in the form of the “Principle of The Necessity to Understand” is natural, general and possible to run. A prerequisite of its use is implementation of the “Curiosity Instinct”, and its unavoidable result is Self-Consciousness.

 

7.     Conclusions

 

The present considerations allow to understand the meaning of self-consciousness for evolutionary development of complex structures. These structures, taking the form of systems processing information, are created and are permanent if they are localised in the thermodynamic niche in the complexity degree function. The degree of complexity of these systems is a reaction to the diversity of the environment. High diversity of the environment provides enormous stream of information, whose proper use guarantees an evolutionary success.

 

However, a system under evolutionary pressure cannot operate directly with a large number of parameters defining the state of the environment. It has to select a function of motivation to action that generalises a stream of data, received by the senses from the environment. The competition is won by those systems (organisms), which hold the most effective systems of data compression and are able to compare them fast, on the highest level of generalisation [Edelman, 1992],[Schmidhuber, 2002].

 

This possibility is provided by animal minds, and the essence of their special properties is a mechanism of creating reality patterns and comparing them with those that are generated, thanks to curiosity and patterns taken from memory. These patterns, transmitted in the form of excitations of neural cells groups up the processing hierarchy, are subject to generalisation and hence compression, forming a general model of the environment, described in categories of a high abstraction level. This leads to formulation of the Principle of the Necessity to Understand, as a principle constituting the most efficient data compression system, ensuring an evolutionary success.

 

What do machines need this self-consciousness for? If we want machines to perform tasks that we define, it is better not to equip them with self-consciousness. If, however, we would like them to be interested in self-learning, knowledge acquisition, learning a logic that is beyond our capabilities, there is no other way.

 

A distinctive feature of the presented approach is emergence of self-consciousness without clear contribution of speech. It has been thought that language capability is an essential prerequisite of self-consciousness. This language is of course present in cognitive processes. However, this language is understandable to the mind, i.e. the language of configuration of excitation of neural cells, which are symbols that in a way code mental states. Obviously, the existence of speech centres will allow to associate ideas and categories created previously with the help of words, phonemes, letters, syntax and grammatical principles in yet higher fields, allowing verbal expression of these states. Self-consciousness, therefore, is not a by-product of speech. It is speech that is a result of further development of consciousness, which is in agreement with our observations of evolutionary and individual development.

 

Interest and understanding cannot do without the first person perspective, and not self-consciousness produces an effect in the form of curiosity and understanding but understanding and interest creates self-consciousness. I indicated neural mechanisms of curiosity and understanding, but there are no known mechanisms or constructions which could form the basis of self-consciousness.

 

Thousands of philosophers could not understand self-consciousness because they sought its centre, process, physical phenomenon. There is no such thing. This is an emergent phenomenon. It emerges from a neural network that forms patterns of the environment and has motivation to construct a coherent model of the world. This motivation employs maximisation of correlation of patterns generated by curiosity mechanisms, i.e. excitations of cell networks, which can create such patterns.

This definition applies to animal and artificial brains.

 

  1. Berlyne, D. E., (1954) A theory of human curiosity, British Journal of Psychology, p.180
  2. Dewey R.A. (2007) Psychology: An Introduction,

http://www.intropsych.com/index.html

  1. Crick F. (1994) The Astonishing Hypothesis, The Scientific Search for the Soul, .(London: Simon & Schuster).
  2. Baars B.J., Newman J., Taylor J.G. (1998) Neuronal Mechanism of Consciousness: A Relational Global-Workspace Framework, Toward a science of consciousness II: the second Tucson discussions, vol. 2 Stuart R. Hameroff, Alfred W. Kaszniak, Alwyn Scott.
  3. Oudeyer P.Y., Kaplan F., Hafner V.V.,(2007) Intrinsic Motivation System for Autonomous Mental Development. IEEE Transaction on Evolutionary Computation, 11(2), ss.265-286.
  4. Starzyk J.A., Graham J.T. Raif P., Tan A-H., (2010). Motivated Learning for the Development of Autonomous Systems Cognitive Science Research (in press).
  5. Starzyk J.A., Prasad D.K. (2011) A Computational Model of Machine Consciousness, International Journal of Machine Consciousness (in press).
  6. Edelman G.M., (1992) Bright Air, Brilliant Fire, On the Matter of the Mind (1999), [Przenikliwe powietrze, jasny ogien. O materii umyslu.] Warszawa: PIW
  7. Schmidhuber J. (2002), Exploring the Predictable, Advances in Evolutionary Computing, Springer, 579-612.
09/01/2011

Samoświadomość Maszyn

- autor: Wieslaw Galus

* English version: http://mindconsciousness.wordpress.com/2011/03/03/machine-mind/

 

Umysł w działaniu


W poprzednim artykule/rozdziale starałem się zwrócić uwagę na duże znaczenie instynktu „ciekawości” wykazywanego przez organizmy żywe, a właściwie przez ich mózgi. Wskazywałem na korelację pomiędzy występującą „ciekawością” organizmów żywych przejawiającą się w eksploracji środowiska, motywacji do uruchamiania zasobów poznawczych, poszukiwania alternatywnych rozwiązań, a kształtowaniem (samo)świadomości.

 

W literaturze przedmiotu niewiele jest odniesień do głównej tezy dotyczącej znaczenia ciekawości w kształtowaniu świadomości. I nie chodzi mi o to, iż przejawiana ciekawość przyczynia się do rozwoju inteligencji w rozwoju osobniczym.

 

Ja upatruję w ciekawości jednego z głównych czynników kreujących świadomość. W dodatku jest to czynnik zupełnie niedoceniany, żeby nie powiedzieć, ignorowany. Z wyjątkiem kilku bardzo ograniczonych prób, nie analizowano sposobów modelowania „ciekawości” w maszynach ani potencjału, który jej implementacja tworzy. Przeglądając dostępną literaturę stwierdziłem, że temat ten traktowany jest po macoszemu. Dość rzadko występuje definicja „Ciekawości” w drukowanych dotychczas encyklopediach i to nawet specjalistycznych. Nie ma też wiele na ten temat w pracach czołowych kognitywistów, Cricka, Searle’a, Blocka., Damasio, Casacuberta, i innych. A przecież jakże inaczej wyglądałyby te same rozważania uwzględniające efekt działania tej podstawowej funkcji mózgu:

(Samo)świadomość jest stopniowalna. Prymitywniejsze umysły mogą posiadać stany świadomego postrzegania bez świadomości tego, że są ich świadome. Pozbawione są refleksji dotyczącej własnej odrębności, będącej istotą samoświadomości. Dla umysłów o wyższej inteligencji dostępna staje się samoświadomość. Tu można spekulować o uświadomieniu sobie potrzeby bycia ciekawym i narzuceniu sobie zadania poznania środowiska w celu uzyskania poczucia bezpieczeństwa, dominacji, skuteczności działania itp.

 

Znamy skuteczne strategie ewolucyjne, które pozwalają istnieć istotom o tak różnych stopniach świadomości. Jednakże, pod warunkiem, że ich umysły kształtowały się pod wpływem ciekawości.

Ale jak to się realizuje!? Jakie jest materialne podłoże ciekawości? Oto pytania, na które należy znaleźć odpowiedź w celu zrozumieniu jak powstaje świadomość.

 

Zdumiewającą hipotezę Cricka, że procesy myślowe są produktem mózgu, w świetle współczesnych badań można uszczegółowić, pamiętając, iż mózgi zwierząt tworzone są głównie przez astrocyty łączące się wzajemnie oraz z receptorami i efektorami przy pomocy neuronów. Można w uproszczeniu przyjąć, że w astrocytach i w synapsach neuronów rejestrowane są ślady chemiczne działalności mózgu, a bodźce elektryczne przewodzone są pomiędzy astrocytami głównie za pomocą neuronów. Taki podział funkcji astrocytów i neuronów sugeruje, iż pamięć długookresowa związana jest z chemicznymi stanami astrocytów oraz synaps neuronowych, a przetwarzanie informacji i pamięć krótkookresowa z ich stanami elektrycznymi oraz stanami pobudzenia elektrochemicznego neuronów.

 

Zdolność logicznego przetwarzania w mózgu realizowana jest nie dzięki złożonym programom funkcjonowania poszczególnych astrocytów lub neuronów ale głównie poprzez odpowiednią strukturę licznych połączeń stosunkowo prostych elementów. Astrocyty, mając wpływ na funkcjonowanie neuronów i na wzmacnianie lub blokowanie połączeń synaptycznych mogą dostosowywać tę strukturę połączeń do bieżących zadań i rezultatów dotychczasowych doświadczeń. W rezultacie struktura połączeń w systemie jest modyfikowana przez stany chemiczne astrocytów, a więc to sieć systemu, jako całość, jest siedliskiem pamięci. Struktura połączeń decyduje o wszystkich funkcjach mózgu jak rozpoznawanie złożonych bodźców, pamięć, selekcja, funkcje uogólniania informacji (generalizacji) i skojarzeń (asocjacji). Sposób połączeń neuronalnych i budowa mózgu pozwala wyodrębnić wyspecjalizowane pola, w których przetwarzane są docierające do nich sygnały w postaci elektrochemicznego pobudzenia astrocytów i elektrycznego pobudzenia prowadzących do nich neuronów. Badania neurologiczne odsłoniły zręby struktury mózgu i szlaków komunikacji pomiędzy poszczególnymi ośrodkami, które dają nam pogląd na niezwykły stopień komplikacji i jego piękno.

 

Ta hierarchiczna struktura funkcjonalna znajduje odzwierciedlenie w warstwowej strukturze kory mózgowej a także w kolejności przekazywania informacji do kolejnych obszarów mózgu odpowiedzialnych za jego poszczególne funkcje. To tam dokonywane jest grupowanie bodźców w postaci pobudzeń grup komórek nerwowych, selekcja bodźców podlegających obróbce i rozpoznaniu na zasadzie mechanizmu konkurencji, asocjacje z podobnym lub powiązanymi bodźcami tworzące skojarzenia oraz ich uogólnienie (generalizacja). Uogólnienia te osiągają coraz wyższy poziom abstrakcji i umożliwiają tworzenie nowych modeli rzeczywistości lub nowych pojęć.

 

Świadomość wzrokowa – rozpoznawanie obrazów

 

Przykładem może być sposób powstawania obrazu w ludzkim bądź zwierzęcym mózgu. Poszczególne struktury nerwowe, do których przekazywane są sygnały wzbudzane przez bodźce otrzymywane z receptorów, wyspecjalizowane są w rozpoznawaniu specyficznych cech obrazu takich jak położenie punktów, linie pionowe i poziome, linie krzywe i ich sploty i przecięcia, kontury, specyficzne figury i wzory, kolory, ruch, itp. Struktury te tworzone są przez pola komórek siatkówki i pola neuronów otoczonych astrocytami będącymi odbiorcami tych sygnałów. Tworzą one pola mające formę map przestrzennych odtwarzających w pewnym stopniu przestrzenne rozmieszczenie komórek siatkówki oka (nazywamy je mapami retinotopowymi). Sygnały z tych struktur przekazywane są w formie stanów pobudzeń impulsami elektrycznymi neuronów transmitujących impulsy elektryczne i elektrochemiczne do astrocytów. Stwierdzono także liczne połączenia aksonowe zwrotne do struktur wcześniej reagujących na bodziec a więc zakładamy, iż niżej znajdujących się w tej hierarchii przetwarzania. Informacje przekazywane są głównie w kierunku warstw korowych a następnie pól przetwarzających coraz wyżej umieszczonych w hierarchii przetwarzania. Stwierdzono jednakże intensywny zwrotny strumień informacji płynący ze struktur wyższego rzędu do struktur niższego rzędu. Może on zmieniać warunki percepcji, dostosowując je do warunków widzenia. Być może też, strumień ten odpowiedzialny jest za występujące sny, wspomnienia i wyobrażenia.

 

Przyjmuje się, że ośrodki leżące wyżej w hierarchii przetwarzania integrują i analizują sygnały otrzymywane z wyspecjalizowanych struktur niższego rzędu. W ten sposób np. w ciele kolankowatym (jedna z licznych struktur mózgowych występująca u naczelnych) mogą być przetwarzane informacje ze struktur wyspecjalizowanych w rozpoznawaniu prostych składników obrazu. Można założyć, że ze składowych tych, poprzez sumowanie pobudzeń, tworzone będą kompleksy odpowiadające bardziej złożonym cechom obrazu. Można także przyjąć, że następuje stopniowe przejście od pól zajmujących się pojęciami i wydarzeniami ogólnymi do tych, które zajmują się unikalnymi, niepowtarzalnymi obiektami i zdarzaniami.

 

Ta wysunięta przez Damasio hipoteza podchwycona jest przez Cricka, który wychodząc od opisu funkcjonowania pojedynczego pola wzrokowego, tak opisuje działanie tej hierarchicznej struktury:

 

Każde pole tworzy nowe cechy danego obiektu, zestawiając cechy skonstruowane już przez inne pola (na ogół zajmujące niższe miejsca w hierarchii), które przesyłają sygnały do jego warstw środkowych.

Idąc w górę tej hierarchii, przechodzimy na przykład od pola V1 kory mózgowej, które zajmuje się dość prostymi, powszechnie występującymi cechami bodźca wzrokowego (takimi jak orientacja linii składowych, np. krawędzi), do rejonów, których domeną są znacznie rzadziej pojawiające się obiekty, jak twarze, a w końcu docieramy do części kory związanej z hipokampem, reagującej na różne kombinacje sygnałów (zarówno wzrokowych, jak i innych), których przeważająca większość odpowiada pojedynczym, niepowtarzalnym zdarzeniom.” F. Crick: „Zdumiewająca hipoteza, czyli nauka w poszukiwaniu duszy” 1997., Pruszyński S-ka, Warszawa

 

Łatwo wyobrazić sobie, iż tak przebiegający proces widzenia, rozpoznawania obrazu w formie pobudzenia elektrycznego komórek nerwowych, neuronów i astrocytów, pozostawi ślady pamięciowe, zarówno chemiczne w astrocytach, jak i w postaci zmiany struktury połączeń neuronalnych poprzez oddziaływanie na synapsy. O ile stany pobudzenia komórek identyfikować można z pamięcią krótkotrwałą, to wymienione wyżej ślady pamięciowe odpowiedzialne są za pamięć obrazową długotrwałą.

 

Należy zwrócić uwagę na fakt, że na wyższych piętrach dokonujących przetwarzania informacji nie tworzy się nic, co odzwierciedlałoby obserwowany przez oko i rzutowany na siatkówkę obraz. Po prostu pobudzane są komórki nerwowe reprezentujące uogólnione symbole dostrzeganych cech obiektów. W ten sposób umysł rejestruje fakt rozpoznania składowych obrazu. Wyodrębnia je po charakterystycznych zestawach pobudzonych komórek rozpoznających bardziej elementarne cechy. Zorganizowanie tych zestawów następuje poprzez odpowiednie połączenia komórek zmysłowych (np. czopków lub pręcików siatkówki oka) z komórkami pól wzrokowych. Połączenia te odpowiadają zasadom grupowania sygnałów stosowanym w sieciach neuronowych imitujących działanie zmysłów, w tym widzenia. Mają one prawdopodobnie charakter wrodzony i tworzą się w okresie wzrostu mózgu. Komórki nerwowe wszystkich poziomów hierarchii pól wzrokowych nie przywiązują wielkiej wagi do tego, gdzie w polu widzenia występuje pobudzająca je cecha. Mimo tego, powstająca w mózgu symboliczna reprezentacja oglądanej rzeczywistości posiada doskonałą organizację przestrzenną pozwalającą na stworzenie jej pełnego, trójwymiarowego obrazu.

 

Ciekawym przykładem takiego sposobu funkcjonowania mózgu jest tworzenie obrazu otoczenia na podstawie odbieranych odbitych sygnałów ultradźwiękowych w mózgu nietoperza. Sygnały te w żadnym razie nie odzwierciedlają przestrzennego kształtu otaczającego środowiska. A jednak ze skuteczności i sprawności poruszania się nietoperza w tym środowisku można wnioskować, że w jego mózgu tworzy się taki obraz.

 

Podobny, choć nieco prostszy schemat działania, prowadzi do powstania przestrzennej sceny dźwiękowej w wyobraźni ludzkiej. Dzięki słyszeniu dwuusznemu jesteśmy w stanie odtworzyć ustawienie instrumentów w orkiestrze symfonicznej. Daleko nam jednak do zlokalizowania ćmy przelatującej przed sceną, choć dla nietoperza nie stanowi to problemu.

 

Sygnały pobudzenia z niższych warstw, usytuowanych bliżej pól rejestrujących sygnały docierające bezpośrednio z komórek receptorowych, trafiają do komórek nerwowych wyższej warstwy lub też nowego pola wyżej umiejscowionego w hierarchii przetwarzania. Neurologiczny mechanizm tego pobudzenia nie jest klarowny, ze względu na niezbyt dobrze poznaną rolę astrocytów w tym procesie. Wcześniejsze prace wskazują na występowanie stanów pobudzeń neuronów łączących się z komórkami wysyłającymi te sygnały. Obecnie sugeruje się, że to właśnie astrocyty łączące się z neuronami wyższych warstw są adresatami tych sygnałów. Wydaje się uzasadnione przypuszczenie, iż niezależnie od szczegółowego mechanizmu, to komórka nerwowa (astrocyt lub neuron) przyjmuje także stan pobudzenia demonstrujący się zmianą charakteru wysyłanych sygnałów. Jej pobudzenie zależy od wielkości docierających sygnałów a także ich synchronizacji w czasie. Stan pobudzenia objawia się zmianą charakterystyki częstotliwościowej generowanych impulsów elektrycznych lub, w przypadku astrocytów wstrzyknięciem porcji jonów wapniowych inicjujących przesyłanie sygnałów elektrochemicznych do innych komórek nerwowych. Ponieważ, jak stwierdzono, reakcja receptorów zależy od kontekstu, czyli od odbieranych sygnałów przez sąsiednie receptory (czopki lub pręciki siatkówki w przypadku widzenia), to można wnioskować, iż wyższe pola wzrokowe przesyłają sygnały zwrotne do komórek pól niższych. Sygnały te zmieniać mogą siłę połączeń synaptycznych doraźnie, a czasami trwale je wzmacniając, w czym upatruje się jeden z mechanizmów pamięci trwałej bądź też chwilowo je blokując, przez co tworzą zmienioną sieć połączeń a więc zmieniają warunki grupowania. Mogą w ten sposób zmieniać także warunki propagacji sygnałów, przez co ulec może zmianie charakter reagowania na docierające sygnały, przez co grupa komórek uzyska możliwość wykonywania złożonych operacji logicznych, podczas gdy pojedyncza komórka nerwowa zdolna jest do reagowania lub nie reagowania na pobudzenie. W sztucznych sieciach neuronowych odpowiada to zastosowaniu mechanizmu tzw. zwrotnej propagacji, to jest zwrotnemu przesyłaniu informacji o skutkach zmiany stanu sieci transmisyjnej do niższych pięter percepcyjnych. Sekwencja działań logicznych dokonywanych przez grupy komórek nie jest zdeterminowana przez algorytm procesora (odpowiednik procesora w ogóle tutaj nie występuje), a poprzez zmianę połączeń w systemie przekazywania informacji równolegle we wszystkich kanałach jej przetwarzania. Dynamika zmiany tych połączeń decyduje o możliwości reakcji na rozpoznawane obrazy.

 

Aby zapewnić istnienie użytecznych życiowo korelatów nerwowych obserwowanych obrazów, konieczne jest właściwe zorganizowanie sieci połączeń na wyższych szczeblach hierarchii przetwarzania. Wytworzenie takiej sieci może być efektem uczenia się rozpoznawania obiektów w okresie rozwojowym. Dla zdobycia pełnego obrazu środowiska, w którym porusza się zwierzę konieczne jest skojarzenie obrazów rejestrowanych w bieżąco obserwowanej scenie z obrazami miejsc sąsiadujących przestrzennie lub czasowo. Obrazy te przechowywane muszą być w jego pamięci. Dla ich przywołania konieczne jest wysłanie wstecznych sygnałów pobudzających komórki niższych szczebli odpowiedzialnych za tworzenie tych obrazów w chwili ich rejestrowania. Pobudzenie ich spowoduje powstanie takiego samego wrażenia wzrokowego z przeszłości, przetwarzanego równolegle z obrazem aktualnie obserwowanym, przez co możliwe jest porównywanie tych obrazów, wyszukiwanie części wspólnych i inne zaawansowane operacje przetwarzania. Nie ma tu mowy o wysyłaniu tych sygnałów pobudzających na przykład bezpośrednio do receptorów. Wystarczy przywołać wrażenia rejestrowane na wyższych piętrach ich rozpoznawania, a poziom do którego sięga umysł wyznaczony jest przez stopień szczegółowości porównywania obrazów. Pobudzając zwrotnie komórki, w których przechowywany jest inny, lecz podobny obraz otoczenia, oraz obrazy obszarów sąsiadujących, umysł może stworzyć model otoczenia i określić swoje w nim położenie.

 

Ale jaki mechanizm zmusza umysł do ciągłego pobudzania innych ośrodków w celu wygenerowania wrażeń wiążących się z aktualnie analizowaną informacją pochodzącą z pola widzenia? Mechanizmem tym jest „Ciekawość”.

 

Ośrodek porównujący i tworzący obraz może wysyłać sygnały do efektorów powodujących poruszanie się zwierzęcia i zmuszających zwierzę do zmiany kąta widzenia, lepszej akomodacji oka, zbliżenia się do obserwowanego przedmiotu w celu uzyskania większej ilości informacji umożliwiającej jego rozpoznanie. Działanie tego „przymusu” poznania nazywam ciekawością. Przy takim zdefiniowaniu tej cechy zrozumiałe się staje, że nie jest to emocja jak dotychczas sądzono, lecz przemożny instynkt umożliwiający umysłowi zbudowanie modelu rzeczywistości. Oczywiście takiemu zachowaniu systemu rozpoznającego jakim jest zwierzę w tym aspekcie, mogą towarzyszyć emocje mające nawet fizjologiczne odwzorowanie. Stanie się tak, kiedy sygnał kierowany będzie również do efektorów w postaci gruczołów wydzielania dokrewnego. Wówczas zachowanie zwierzęcia może zostać zdynamizowane poprzez wzrost poziomu adrenaliny, lub innych hormonów wpływających na jego sposób reakcji. Ciekawość zmuszać będzie zwierzę do aktywności zwiększającej jego potencjał poznawczy.

 

Świadomość – rozpoznawanie stanów umysłu

 

Jeśli ten hipotetyczny schemat tworzenia i rozpoznawania obrazu zaakceptujemy, dlaczego mielibyśmy nie rozszerzyć tego schematu na tworzenie pojęć i odczuć o wyższym stopniu abstrakcji? Na tej drodze mogą być rozpoznawane inne sygnały. Na przykład dźwiękowe, zapachowe, dotykowe i wszelkie inne. W ten sposób mogą być także rozpoznawane struktury złożonego języka logicznego. Na tej drodze wreszcie, mogą być także rozpoznawane bardziej złożone stany umysłu odpowiadające pojęciom abstrakcyjnym, takim jak symetria, piękno, poczucie znajomości obiektu, a także stany emocjonalne, takie jak strach, czyli poczucie nieznajomości obiektu lub sytuacji, zachwyt lub dobro, zło czy miłość.

 

Synchronizacja sygnałów o podobnym charakterze z grup komórek nerwowych (prawdopodobnie astrocytów) przechowujących informacje o podobnych obiektach pozwala na uzyskiwanie wzmocnionych lub osłabionych sygnałów, które jeśli osiągną wymagane progi pobudzenia, to zapamiętane zostaną jako uogólnienie informacji zawartej w tych grupach komórek. Także natężenie biegnących z różnych grup komórek sygnałów może powodować dominacje prowadzonych równolegle procesów przetwarzania dotyczących określonej grupy informacji. Odpowiadać to będzie „skupieniu uwagi” na myśleniu na określony temat. Spodziewać się można, że w mózgu istnieje „ośrodek uwagi”, to jest kolejne pole, w którym skupiają się komórki zapamiętujące wrażenie „skupienia uwagi” i które mają zdolność wysyłania sygnałów blokujących częściowo informację płynącą z innych, konkurencyjnych ośrodków. Istnienie takiego ośrodka uwagi radykalnie wzmocniłoby działanie konkurencji sygnałów. Wówczas zasada „zwycięzca bierze wszystko”, wynikająca z progowych właściwości komórek odbierających sygnały, spotęgowana byłaby działaniem tego centralnego ośrodka. W efekcie, umysł uzyskałby możliwość niezwykłej koncentracji na wykonywanym zadaniu.

 

Ośrodki wysokiego poziomu, reprezentujące stany umysłu nie muszą być tak liczne, jak komórki wszystkich pól, w których przetwarzane są kolejne fazy rozpoznawania informacji. Ze względu na hierarchiczną strukturę, blokowane mogą być tylko sygnały z obszarów odpowiedzialnych za pośredni stopień uogólnienia informacji. Chyba że z pól niżej umieszczonych w hierarchii przetwarzania, mimo blokady, przebiją się sygnały tak silne, że uwaga przełączy się na nowy problem, poszukując znów zespołów sygnałów o ustalonym wzorcu odpowiadającym innej komórce symbolizującej znany już obiekt. Dotarcie tego wzorca do adresata, może wygenerować sygnał do ośrodka uwagi koncentrując ją na nowym zadaniu.

 

Ciekawość, poszukując alternatywnych rozwiązań, porusza i uruchamia różne przypadkowe struktury pamięciowe, które wstecznie pobudzają pola wcześniejsze, a te z kolei wytwarzają wrażenia przypominane. Prawdopodobnie nieustannie pobudzane są równolegle prawie wszystkie struktury dolnych poziomów. Odpowiada to procesowi „eksploracji otoczenia”, jednakże prowadzonemu w naszej wyobraźni. Równoległe pobudzenie różnych ośrodków wywoływać może nawet odległe skojarzenia, jeśli tylko umysł odnajdzie połączenia, którymi prześle sygnały pobudzające. Wyobraźmy sobie przywoływanie skojarzenia: czerwone wiśnie – kwaśny smak. Spowodowane ono może być wysyłaniem sygnału z komórki pobudzanej na widok wiśni, to jest w momencie jej rozpoznania. Przesłanie sygnałów do niższych pięter pól wzrokowych przywołać może obraz wiśni. Przesłanie sygnałów do wyższych poziomów hierarchii a stąd do ośrodków smaku przywołać może poczucie smaku słodko-kwaśnego. Impuls początkowy może też zostać wygenerowany przez struktury logiczne języka. Może to być efekt wyszukiwania np. rzeczowników i przyporządkowywania im cech. Nawet jeśli jest to tylko zabawa logiczna w sferze nazw lub cech ich zapisu, możliwe jest w każdej chwili włączenie marzeń i przywołanie wyobrażenia owocu i jego smaku.

 

Wywoływane w wyobraźni wrażenia docierają do wyższych pięter, gdzie sumowane i porównywane, w zależności od wyniku przesyłane są do pól i rejonów uogólniających. Ośrodki odpowiedzialne za abstrakcyjne myślenie przeprowadzają proces kojarzenia asocjacyjnego, po czym zapamiętują je jako wrażenia wyższego rzędu, takie jak „poczucie rozpoznania”, „zrozumienie”, „model”, „satysfakcja twórcza” itp. Tworząc zestawienia odtwarzanych wrażeń, nie występujące w doświadczanej rzeczywistości, umysł doprowadza do kreacji nowych modeli. Tak objawiać się mogą zdolności twórcze.

 

Dla zaistnienia dynamicznej aktywności pobudzającej umysł do tych twórczych skojarzeń musi występować „ciekawość”, jako wykraczanie poza zakres sygnałów aktualnie porównywanych. Działać ona będzie poprzez wysyłanie wstecznych sygnałów pobudzenia do różnych struktur wykazujących pokrewieństwo (połączenia) ze strukturami pamiętającymi problem aktualnie przetwarzany. To wysyłanie sygnałów musi być wrodzoną koniecznością, dlatego „ciekawość” tak zrodzoną, nazwać można instynktem. Ma ona charakter nieuświadomiony, działa automatycznie i poniekąd chaotycznie. Ciekawość tak zdefiniowana odpowiada ciekawości perceptualnej (według Berlyne) lub fizycznej (Dewey). Powyższa interpretacja jej funkcjonowania nadaje definicji Dewey’a nowy sens.

 

Aby umysł miał dostęp do zapamiętywanych stanów umysłowych, tworzone muszą być połączenia neuronowe struktur pamięciowych odpowiedzialnych za rejestrację tych stanów ze strukturami na wyższych piętrach, które tworzą następnie nową kombinację tych stanów, odpowiadającą bardziej złożonym stanom umysłu. Te bardziej ogólne stany umysłu odpowiadające procesowi generalizacji są zapamiętywane w nowych, jeszcze wyższych polach. Połączenia te muszą mieć kanały zwrotne, umożliwiające komórce z wyższego piętra pobudzenie zespołu z piętra niższego, przez co wygenerowane zostanie wrażenie, lub stan umysłu podlegający ponownemu przetworzeniu: zapamiętaniu i porównaniu logicznemu z innymi sygnałami. Sygnały te płyną z równolegle działających struktur przetwarzających inne informacje, ale przynajmniej ze względu na synchronizację czasową, powiązane są z analizowanym właśnie sygnałem. Ta synchronizacja czasowa i koordynacja przestrzenna prawdopodobnie jest istotnym elementem mechanizmów grupowania. Następuje oczywiście naturalna konkurencja tych sygnałów o „uwagę”, jak to opisano powyżej.

 

To właśnie wysyłane do niższych struktur sygnały wspomagane przez procesy modyfikacji sieci połączeń komórek pamięciowych, które dynamicznie zmieniają transmisję tych połączeń, tworzyć mogą emergentne zjawisko ciekawości całego układu integralnie wynikające z jego struktury. Jest to nowa funkcja tych komórek pamięciowych, które odpowiedzialne są za przechowywanie fundamentalnych informacji o zaistnieniu i ciągłości świadomości. Astrocyty, bo o nich tu mowa, dysponują możliwością kreowania nowych połączeń neuronowych, jak również ich unicestwiania lub blokowania a prawdopodobnie, oddziałując na synapsy, mają możliwość radykalnej zmiany charakterystyki propagacji sygnałów wewnątrz mózgu. Może się to odbywać na wielu drogach, chociażby poprzez wpływanie na powstawanie osłonek mielinowych polepszających warunki transmisji sygnałów w aksonach. Stwierdzono także liczne podziały astrocytów a przez to tworzenie nowych komórek pamięciowych i nowych szlaków przekazywania informacji. Szlaki te prowadzić mogą do innych, wysoce wyspecjalizowanych struktur mózgowych.

 

W mózgach żywych organizmów nowym rodzajom rozpoznawanych wrażeń towarzyszy nie tylko powstawanie nowych struktur zdolnych do zapamiętywania tych wrażeń, ale przede wszystkim powstawanie nowych połączeń pomiędzy komórkami w jakikolwiek sposób powiązanymi ze strukturami, w których te wrażenia są zapamiętywane. Powiązania te, być może powstają na zasadzie bliskości przestrzennej, ponieważ uogólnione wrażenia lokowane są w sąsiedztwie struktur zajmujących się podobnymi „zagadnieniami”. Mogą w ten sposób powstawać pola zawierające „mapy problemów”, którymi zajmuje się mózg, analogiczne do tych tworzonych dla przetwarzania sygnałów wzrokowych i rozpoznawania obrazów (mapy retinoskopowe). Jedynym, jak dotychczas uzasadnieniem tej hipotezy, jest poszukiwanie prostoty rozwiązań, pamiętając o ewolucyjnej genezie mózgów zwierzęcych. Mózgi zwierząt ewoluowały w kierunku umożliwiającym im odgadywanie najbardziej wiarygodnej interpretacji otrzymywanych bodźców i danych przechowywanych w ich pamięci przy pomocy jak najprostszych środków. Wykorzystanie bliskości przestrzennej wydaje się bardzo prostym lecz jednocześnie skutecznym środkiem. Sąsiedztwo pól odpowiedzialnych za rozpoznawanie złożonych pojęć może mieć bardzo istotne znaczenie dla ich kojarzenia, dzięki łatwości ich pobudzania generowanymi przez astrocyty falami jonów wapniowych, które są podstawowym środkiem komunikacji astrocytów praktycznie ze wszystkimi sąsiednimi astrocytami. Wspólna lokalizacja komórek nerwowych odpowiedzialnych za zapamiętywanie i przetwarzanie pojęć ogólnych i abstrakcyjnych sugeruje istnienie na najwyższym szczeblu hierarchii specjalnego ośrodka tych pojęć. Wydaje się naturalne, że zapamiętane tam korelaty neuronowe pojęć wykorzystane mogą zostać do realizowania innych, ważnych życiowo funkcji. Oczywiście nie stoi to w sprzeczności z faktem, że pobudzając grupy komórek związanych z konkretnym pojęciem, wrażeniem czy obrazem, pobudzamy równocześnie komórki w innych ośrodkach, do których szlak przekazywania bodźców został wcześniej ustalony. Należy przypuszczać, że dzieje się tak za pośrednictwem struktury hierarchicznej. Tak więc spodziewać się można, że „drzewu” powiązań pól przetwarzania „w górę” towarzyszy „drzewo” powiązań zstępujących do innych ośrodków, a tam w dół hierarchii przetwarzania.

 

System wyposażony może być w „generator mowy”, czyli ośrodek przetwarzania, który tworzyć może symbole odpowiadające zestawom stanów struktur pamięciowych na najwyższym szczeblu przetwarzania. Jeśliby ośrodek uwagi połączony był z takim „ośrodkiem”(generatorem) mowy, to każdorazowo, gdy pobudzona jest określona struktura pamięciowa na skutek wysłania sygnału przez ośrodek uwagi, generator „wypowiadałby” odpowiadające mu „słowo”(symbol). Wystarczyłoby to dla systemu mającego za zadanie rozpoznawanie obiektów, procesów, problemów i ich sygnalizowanie.

 

Trudniejszym zadaniem będzie „nauczenie” porozumiewania się ze zrozumieniem celu.

Żeby to osiągnąć, system musi rozpoznawać sekwencję zdarzeń, czyli musi umieć uszeregować otrzymywane bodźce według kolejności ich pojawiania się. Dla praktycznych celów, to ustalenie kolejności powinno być umiejscowione w czasie. Wówczas będzie możliwe definiowanie relacji czasowych pomiędzy zdarzeniami i w efekcie wprowadzenie reguł składni sygnalizujących te relacje. Relacji czasowych dostarcza nam kojarzenie obserwowanych zdarzeń z sygnałami dźwiękowym rejestrowanymi przez uszy. Kolejność docierających dźwięków, szczególnie pojawiających się rytmicznie, pozwala nadać wymiar czasowy obserwowanym równocześnie zjawiskom z dużo lepszą precyzją. Zbieżne jest to z wymaganiami jakie stanowi rozpoznawanie mowy. Receptory słuchu zdolne są do przekazania informacji pozwalających polom wyższego rzędu wyodrębniać fonemy i morfemy, a z nich składać wyrazy zapamiętując ich kolejność w czasie. Pola zapamiętanych wyrazów bez wątpienia łączą się z polem „generatora mowy”, w którym przechowywane są instrukcje wydobywania dźwięków odpowiadających rozpoznawanym fonemom. Ich połączenie we właściwej kolejności generować może słowa zrozumiałe jako język komunikacji. Należy przypuszczać, iż osobniki dysponujące umiejętnością pisania mają trwale skojarzone odpowiednie komórki kolejnego pola pamięci. Pamięci symboli określających litery, sylaby, wyrazy odnoszące się do zapamiętanych słuchowo ich brzmień. I wreszcie wszystkie te pola muszą mieć możliwość wymiany sygnałów koincydencyjnego pobudzenia z polem wrażeń definiowanych przez stany pobudzeń komórek sygnałami docierającymi poprzez receptory i niższe pola ze świata zewnętrznego. Niewykluczone, że oprócz pól zawierających elementarne składowe, litery i fonemy, w wymienionych powyżej polach zapamiętywane są całe słowa a nawet określenia pasujące do rozpoznawanych w polach receptorowych obiektów. Olbrzymia pamięć, jaką dysponuje mózg zwierzęcy umożliwia rozrzutność tworzącą olbrzymią redundancję, ale ułatwiającą i przyśpieszającą komunikację.

 

Zdolność lokalizowania zdarzeń w czasie jest niezbędna dla świadomości własnej historii. Toteż zazwyczaj „zdajemy sobie sprawę” i zapamiętujemy w jakim czasie nastąpiło dane zdarzenie. Dla zjawisk trwających krótko wystarczy zapamiętanie sekwencji zdarzeń. Bezwzględny upływ czasu ma wówczas charakter subiektywny. Dla rejestracji zdarzeń w pamięci trwałej konieczne jest odniesienie zdarzenia do innych zjawisk cyklicznych. Pobudzając struktury przypominające to zdarzenie pobudzamy równocześnie komórki z nim kojarzone. Uzyskujemy w ten sposób możliwość określenia bezwzględnego terminu zajścia tego zdarzenia.

 

Operowanie symbolami reprezentującymi rozpoznane zjawiska odpowiada stosunkowo prymitywnemu poczuciu świadomości. Jak już wielokrotnie wspominałem, świadomość jest stopniowalna a jej przyrost skorelowany jest z rozwojem języka komunikacji oraz zdolnościami poznawczymi, które z kolei napędzane są „instynktem ciekawości”.

 

Toteż rozwinięcie języka logicznego pozwala uzyskać wyższy stopień świadomości nazywany samoświadomością, poczuciem własnego „Ja”, zdawaniem sobie sprawy z własnej odrębności. Możliwe, że pewien stopień samoświadomości jest dostępny także dla istot operujących jedynie najprostszym językiem symbolicznym. Przecież łatwo sobie wyobrazić spostrzeżenie konsekwencji własnego zachowania w złożonym środowisku nawet bez werbalizacji własnych odczuć. Jednakże wyobrażenia takie zawsze będą miały charakter subiektywny i spekulatywny, ponieważ brak języka komunikacji wzajemnej uniemożliwia rozpoznanie stopnia takiej świadomości.

 

Do czego umysł wykorzystuje ciekawość?

 

Umysł ciągle poszukuje wzorców charakteryzujących się tym, że stany pobudzeń komórek niższych poziomów wykazują podobieństwo do zespołu bodźców aktualnie generowanych przez zmysły lub przez wyobraźnię pobudzoną mechanizmem ciekawości. Oznacza to nieustanne poszukiwanie podobieństw. Grupa bodźców musi być czemuś przyporządkowana. To także jest objaw ciekawości. Nieprzyporządkowany niczemu obiekt przyciąga uwagę umysłu. Zmysły próbują uzyskać na jego temat więcej informacji. Np. w ciemnym lesie majaczące w mroku cienie muszą być rozpoznane jako drzewa, krzaki, zwierzęta. Póki tak się nie stanie, to staramy się im przyjrzeć, chyba, że nierozpoznane, budzą strach, i wówczas staramy się od nich oddalić.

 

Jeśli są to bodźce wewnętrzne, generowane przez niższe pola mózgowe, to umysł także stara się nadać im znaną już formę. Dlatego w marzeniach sennych rozpoznajemy oglądane już elementy świata, choć dalekie od realności. Na wyższym poziomie abstrakcji, gdy nasze myślenie dotyka pojęć ogólnych, przyporządkowanie tych pojęć do jakiegoś modelu wytłumaczenia zjawiska pozwala zestawiać złożone konstrukcje teoretyczne i logiczne owocujące powstawaniem całych dziedzin wiedzy, tworzących opis złożonych zjawisk przyrodniczych. Dążenie do ciągłego uzupełniania bazy wyobrażeń, pojęć, modeli niezbędnych do kompletnego opisu rzeczywistości w sposób zgodny z obserwowanymi faktami jest siłą napędową rozwoju nauki.

 

Wreszcie przesyłanie sygnałów zgodności poszczególnych opisów podnoszących różne aspekty zjawiska daje poczucie zrozumienia. Póki takiego poczucia nie osiągniemy, to umysł koncentruje się na tym zadaniu. Intensywność myślenia osiąga najwyższy poziom. Ujawniają się tutaj znane nam funkcje mózgu, a jest to nie tylko kategoryzacja ale i uogólnienie (generalizacja) oraz myślenie asocjacyjne, poszukiwanie skojarzeń, podobieństw w różnych aspektach. Tu przydatna jest ciekawość uświadomiona czyli sformułowana językowo intelektualna potrzeba poznania. Takie pojęcie ciekawości odpowiada „ciekawości epistemicznej” według klasyfikacji Berlyne lub „intelektualnej” według Dewey’a. Można przyjąć, że to poczucie zrozumienia rejestrowane jest także w odpowiednim ośrodku zrozumienia grupującym komórki nerwowe „zrozumienia” podobnie jak „komórki babci” znane z opisów naszego widzenia i rozpoznawania obrazów. Dysponując modelami rzeczywistości dającymi poczucie zrozumienia własnej pozycji w środowisku i własnej odrębności tworzymy nowy zestaw pobudzeń komórek najwyższego rzędu odpowiadający wrażeniu świadomości. Oczywiście poczucie takie także może być zapisane w odrębnej „komórce świadomości”, której stan pobudzenia w jakimś momencie czasowym, będzie nam przypominał, że jesteśmy świadomi. Swoboda wyboru tego momentu oraz pamięć o tym, że już taki sygnał odbieraliśmy będzie rejestrowana jako „trwałość bytu” i oczywiście zapisana w komórce „trwałości bytu”. Czy szereg ten nie ma końca? Dla nas ludzi, już się prawdopodobnie kończy łańcuch abstrakcyjnych uogólnień. Jednakże dla istot od nas lotniejszych, dysponujących większym potencjałem intelektualnym, możliwe są wyższe stany kontemplacji świata. Poczucie „jedności ze światem”, „nirwana” itd..

 

Ciekawość dostarcza umysłowi wciąż nowych wzorców, a umysł posiada potrzebę ich porównywania i uzgadniania. Ta potrzeba uzgodnienia nowych wzorców ze wzorcami przechowywanymi w pamięci jest immanentną cechą umysłu. Umysł nie może funkcjonować nie mogąc osiągnąć stanu zgodności, czyli rozumienia tworzonych przez siebie wzorców rzeczywistości. W celu osiągnięcia tego stanu gotów jest podejmować stały wysiłek poznawczy. Jeśli ten zaś wysiłek nie daje lub nie może dać rezultatu, umysł odczuwa dyskomfort, niepokój, strach a w skrajnych przypadkach panikę i inne emocje negatywne. Jeśli zgodność wzorców i zrozumienie zostanie osiągnięte, to umysł odczuwa emocje pozytywne.

 

Jeśli umysł potrafi osiągnąć stan zrozumienia, że pełne zrozumienie rzeczywistości nie jest możliwe, to stara się stworzyć takie wyjaśnienie w postaci „modelu uzupełniającego” rzeczywistość, co obserwujemy jako ucieczkę do mistycyzmu, do wiedzy sztucznie wymyślonej. To jest droga do wierzeń i zabobonów.

 

Przedłużający się stan braku rozumienia napływających wzorców, dłuższe przebywanie w stanie lęku z tym związanym prowadzi do całego szeregu chorób psychicznych i stanów patologicznych znanych psychologii i psychiatrii.

 

Tak więc potrzeba rozumienia jest więc najbardziej podstawowym instynktem umysłu świadomego. Należy stwierdzić, że dla umysłu świadomego konieczność rozumienia jest najwyższym prawem. Jest to prawo, które wręcz go definiuje.

 

Sztuczna świadomość

 

Jakie procesy przesyłania informacji pomiędzy strukturami mózgu towarzyszą tym zjawiskom?

Czy jesteśmy w stanie skonstruować elektroniczny model mózgu przejawiający ciekawość, świadomość i inne stany umysłu charakterystyczne dla mózgów istot żywych?

 

Badania nad sztuczną inteligencją wykazują oszałamiające postępy. Skonstruowano wiele maszyn wykonujących zadania, do wykonania których człowiek używa inteligencji. Osiągnięto znaczące rezultaty w rozwinięciu systemów sztucznego widzenia i rozpoznawania obrazów. Zbudowano urządzenia do odczytywania pisma, generacji mowy ludzkiej oraz dokonywania tłumaczeń pomiędzy różnymi językami (choć na razie na niesatysfakcjonującym poziomie). Systemy eksperckie stawiają diagnozy przewyższające celnością zespoły ludzkich specjalistów. Maszyny sterowane sztuczną inteligencją wykonują samodzielnie, złożone misje nie wymagając ciągłej, bezpośredniej ingerencji człowieka. Gry komputerowe symulują zachowanie występujących w nich bohaterów, miast i całych krain fantastycznych. Jednakże zdajemy sobie sprawę, że brakuje im rozumienia zadań, które wykonują oraz poczucia odrębności ich własnego „Ja” tak charakterystycznego dla samoświadomości.

 

Większość tych systemów to systemy algorytmiczne. Nie istnieją dotychczas algorytmy symulujące stan świadomości. Istnieje uzasadnione podejrzenie, że na drodze algorytmicznej nie będzie możliwe uzyskanie takiego stanu. Naszym środowiskiem jest Świat w całej swej złożoności. Bogactwo świata, obejmuje zjawiska wysoce chaotyczne a więc niedeterministyczne. Do zbudowania modelu rzeczywistości, który pozwoliłby określić i zrozumieć nasze miejsce w tym środowisku, potrzebne byłyby procedury tworzące opis równie złożony i niedeterministyczny.

 

W ostatnich latach znaczącego postępu w naśladowaniu procesów przebiegających w umysłach istot żywych dokonano w dziedzinie sieci neuronowych kognitywnych. Architektura tych sieci w dużej mierze przypomina, a lepiej powiedzieć intencjonalnie naśladuje budowę mózgu. Większość tych sieci składa się ze stosunkowo prostych elementów – komórek, połączonych wzajemnie w sposób umożliwiając przesyłanie sygnałów do dużej liczby podobnych komórek odpowiadających neuronom. Własności przetwarzania sygnałów determinowane są strukturą sieci połączeń neuronów. Połączenia te mogą mieć zmienną charakterystykę transmisji poprzez elementy, zwane przez analogię z mózgiem, synapsami. Sieci posiadają budowę warstwową, od niższych poziomów sprzężonych z receptorami do poziomów wyższych. Posiadają one możliwość przekazywania bodźców reprezentujących stany mentalne w górę hierarchii od pól sprzężonych z receptorami do wyższych poziomów przetwarzania. Stany mentalne to konfiguracje stanów pobudzeń neuronów docierające do komórek wyższej warstwy. Są one wyznaczane przez matryce określające stany blokowania lub transmisji synaps, które zapamiętywane są w pamięci trwałej. Przekazywane w ten sposób do wyższych warstw informacje o odbieranych wrażeniach tworzą drzewiastą strukturę odpowiadającą hierarchicznej organizacji wzorców mentalnych. Taką budową odznacza się np. tworzona sieć kognitywna w ramach projektu „The Novamente AI Engine” (Goertzel 2006).

 

Sieci te podzielone są zwykle na ośrodki wyspecjalizowane w przetwarzaniu informacji o specyficznych właściwościach dotyczących zróżnicowanych aspektów i różnych stopni uogólnienia strumienia stanów mentalnych płynących z niższych poziomów. Umożliwiają one wymianę i kojarzenie pojęć lub wrażeń o różnym stopniu uogólnienia dotyczących różnych aspektów odbieranej przez receptory i analizowanej rzeczywistości. Sieci te uczone są rozpoznawania wzorców obiektów, obrazów, symboli poprzez technologię uczenia „pod nadzorem” lub „z krytykiem”. Są też próby wyposażania sieci o architekturze symbolicznej w bazy danych zawierających olbrzymią ilość informacji o świecie o charakterze encyklopedycznym (baza CYC).

 

Większe perspektywy stwarzają systemy o architekturze emergentnej. Baza danych/wzorców powstaje w nich w procesie uczenia. Możliwe jest także łączenie zalet obu rodzajów architektury w systemach mieszanych (architektura hybrydowa). W tych zaawansowanych systemach, podobnie jak w mózgu ludzkim świadomość wyłania się emergentnie, jako proces tworzenia wzorca środowiska i zadań realizowanych przez system. Realizowanych jest obecnie wiele projektów, których zadaniem jest uzyskanie inteligentnych systemów rozpoznawania i reagowania na złożone bodźce w dynamicznie zmiennym środowisku. Ich inteligencja zapewnia olbrzymią skuteczność, niezawodność i elastyczność, czyli dostosowanie reakcji do zmian warunków realizacji.

 

Aczkolwiek wykonywanym przez te systemy funkcjom przypisujemy cechę świadomości „doznawanych” wrażeń, to jednak w dalszym ciągu ich świadomość nie przypomina ludzkiej. My mamy świadomość, iż świadomość zaprojektowanych przez nas systemów różni się od naszej. Brak jest samoświadomości i zrozumienia wykonywanych funkcji, nawet gdy ich skuteczność przewyższa działania ludzkie w danych warunkach. Klucz do różnicy w zachowaniu człowieka i maszyny tkwi w dopisku „w danych warunkach”, bowiem nie możemy być pewni jak sobie poradzi system w warunkach odbiegających od tych, które dotychczas zakładaliśmy.

 

Na pozór wydaje się, że wszystkie warunki do osiągnięcia wysokich stanów samoświadomości są spełnione. Systemy wykonują inteligentne funkcje kategoryzacji, selekcji, kojarzenia i generalizacji, rozpoznają i generują mowę ludzką. Posiadają wspomniane wyżej cechy architektury sieci neuronowej wzorowane na budowie ludzkiego mózgu. Budowane są rozległe sieci zawierające znaczącą liczbę komórek i jeszcze większą liczbę synaps. Stosowane są wyszukane funkcje modulacji synaps ze sprzężeniem zwrotnym obejmującym pojedyncze komórki lub warstwy a także mechanizmy wstecznej propagacji błędów. Odznaczają się pamięcią epizodyczną i długoterminową zarówno rozproszoną jak i zlokalizowaną lub modularną. W pamięci epizodycznej dochodzi do synchronizacji lub rezonansu stanów mentalnych z różnych ośrodków, pozwalających na kojarzenie różnych aspektów pojęć i zdarzeń. Jednakże efekty, mimo wieloletnich starań nie są zadowalające.

 

Może się wydawać, że to zbyt ograniczone zasoby pamięci i komórek w warstwach przetwarzania tworzą ograniczenie dla wypełniania tych wyższych funkcji. Że postępy technologii prowadzące do zwiększenia złożoności sieci, zwiększenia liczby warstw i komórek analizujących w poszczególnych warstwach, lub też połączenie w większą całość struktur wykonujących dotychczas różne funkcje, doprowadzi do osiągnięcia celu niejako samoistnie. Ta hipoteza ekstensywnego wzrostu skali może prawdopodobnie doprowadzić do zamierzonego skutku. Jednakże wielu badaczy, kognitywistów uważa, że to nie w złożoności mózgu kryje się problem i nie w skali liczby jego komórek i połączeń. Zresztą technologia miniaturyzacji podzespołów elektronicznych już w najbliższym czasie pozwoli na gęstość upakowania pamięci porównywalną do systemów biologicznych. Można także minimalizować wymagania na układy przetwarzania zmniejszając szczegółowość i rozdzielczość analizowanych sygnałów. Sztuczny świat sztucznej inteligencji będzie nieco uboższy, ale obrazy można rozpoznawać przy rozdzielczości 200×300 pikseli, nie koniecznie w jakości HD. Uważa się, że brak nam zrozumienia gdzie i jak tworzy się samoświadomość lub, że brak nam jakiegoś czynnika, który sprawi, iż takowa nagle się pojawi.

Próby tłumaczenia, że niedostateczny rozwój technologii i stopień złożoności budowanych dotychczas sieci kognitywnych jest wyłączną przyczyną ich gorszych rezultatów w porównaniu z mózgiem ludzkim nie wytrzymuje krytyki.

 

Hipoteza o niezbędności instynktu ciekawości dla osiągania samoświadomości

 

W artykule „Postrzeganie, świadomość, samoświadomość, inteligencja”, zwróciłem uwagę na pewien szczególny niedostatek budowanych dotychczas kognitywnych sieci neuronowych. Jedną z cech, w którą wszystkie one konsekwentnie nie zostały wyposażone, jest zainteresowanie tym co robią, co jest równoznaczne z brakiem „ciekawości”.

 

W artykule niniejszym przedstawiam hipotezę, że uzyskanie świadomości jest naturalnym procesem, jeśli zdamy sobie sprawę z roli instynktu „ciekawości” tworzącego wewnętrzną motywację do realizowania funkcji poznawczych. Sztuczny mózg musi być wyposażony w mechanizm penetracji zasobów pamięciowych nazywany mechanizmem „ciekawości”. Musi mieć zdolność podążania za asocjacjami znaczeniowymi we własnej pamięci, wykraczania poza teren, na którym był szkolony, wykraczania poza obszar problemowy aktualnie rozpatrywany i sięgania po nowe zadania, które same sobie formułuje.

 

Wydaje się, że predestynowane do takich zadań są złożone, wielowarstwowe sieci posiadające zdolność elastycznej modyfikacji swojej struktury. Komórki takiej sieci (neurony) powinny mieć możliwie prostą strukturę i reagować skokowo na pojawiające się bodźce na wejściach dając na wyjściu stan występowania lub braku pobudzenia. Synapsy, umożliwiając lub blokując transmisję sygnałów, praktycznie modyfikowałyby strukturę sieci, włączając bądź odcinając komórki niższej warstwy. Niewykluczone, iż celowe będzie rozdzielenie funkcji zapamiętywania wzorców stanów w postaci matryc włączenia synaps, poprzez wprowadzenie towarzyszącym neuronom „astrocytów”, czyli komórek pamięci trwałej. Wówczas to one stanowiłyby pamięć trwałą zapamiętując stany mentalne. Stany pobudzeń neuronów stanowiłyby pamięć epizodyczną współpracującą z górnym piętrem pól przetwarzania informacji o większym stopniu uogólnienia.

 

Trzy mechanizmy mogą być odpowiedzialne za realizację funkcji „ciekawości”.

Pierwszy to automatyczny mechanizm eksploracji zasobów pamięciowych poprzez wysyłanie fal pobudzeń do niższych struktur bliższych neuronom czuciowym.

Drugi, to automatyczny mechanizm pobudzeń komórek sąsiednich szczególnie astrocytów zawierających informację trwale zapamiętane. Powodować on będzie rodzaj dyfuzji bodźców docierających do określonej grupy komórek, w których przechowywana jest pamięć o powiązanej grupie obiektów, pojęć, zdarzeń itp. Przypomnieć tu należy prezentowaną powyżej hipotezę o korelacji przestrzennej wrażeń i pojęć o podobnym charakterze.

Trzeci mechanizm to długodystansowe pobudzenie astrocytów przechowujących informacje w jakikolwiek sposób powiązane z problemem znajdującym się w polu uwagi. Powiązanie owe oznacza istnienie wytworzonych uprzednio szlaków przekazywania informacji pomiędzy tymi strukturami. Szlaki te powstać mogą w procesie uczenia się i rozwoju sieci a także w wyniku doświadczeń behawioralnych lub eksperymentów myślowych, wyobrażeń itp. Tak pobudzone odległe astrocyt mogą stać się źródłami nowych spontanicznych fal pobudzeń astrocytów sąsiednich, przez co powstawać mogą nowe, nawet najbardziej zaskakujące skojarzenia.

 

Pobudzenia struktur trwałej pamięci w pobliżu neuronów czuciowych generuje zwrotną, wstępującą falę bodźców ze wszystkich tych obszarów. Powstaje strumień pobudzeń do kolejnych warstw porównujących, selekcjonujących i uogólniających a przez to kompresujących płynącą informację. Sztuczny umysł, realizuje te funkcje poprzez przesyłanie stanów pobudzeń komórek pomiędzy kolejnymi warstwami i polami przetwarzania i zapamiętywania tych stanów w ramach hierarchicznej struktury tych pól, od receptorów aż do ośrodków pojęć najbardziej ogólnych. Tworzy się w ten sposób „drzewo” połączeń od pól czuciowych, rozpoznających obrazy wzrokowe i sygnały generowane przez inne zmysły aż do pól pojęć najbardziej ogólnych oraz charakteryzujących stany umysłu takie jak satysfakcja, zrozumienie i właśnie samoświadomość. Aby uzyskać możliwość wykonywania podstawowych funkcji umysłu, mózg musi stworzyć sieć przekazywania zwrotnych sygnałów o modyfikacji tego systemu połączeń. Tworzone musi być zwrotne drzewo połączeń od pojęć ogólnych do komórek w polach odpowiedzialnych za rozpoznawanie najbardziej elementarnych cech rejestrowanych w receptorach obrazów. Ta sieć, oprócz sygnałów modyfikujących jej strukturę na zasadzie mechanizmu wstecznej propagacji, musi przekazywać sygnały pobudzeń od pól pojęć ogólnych do pól leżących niżej w hierarchii. Pobudzenia takie odpowiedzialne są za odtworzenie wrażeń recepcyjnych z pamięci, umożliwiających ich porównanie z obrazami aktualnie analizowanymi a przez to ich rozpoznawanie. Zgodność tworzonego modelu rzeczywistości z konstruktami generowanymi przez wrażenia z pamięci daje możliwość konstruowania modelu rzeczywistości wyższego rzędu a przez to określenie własnego położenia w środowisku.

 

Właściwa sieć połączeń umożliwiająca zapamiętywanie i przetwarzanie złożonych informacji wymagać będzie uczenia we wszystkich formach stosownych dotychczas w treningu kognitywnych sieci neuronowych. Może tu być stosowane uczenie pod nadzorem, w celu wprowadzenia bazy pojęć o świecie skojarzonej z ich reprezentacjami mentalnymi wprowadzanymi przez zmysły. Dalej spontaniczne uczenie się pod wpływem ciekawości może być korygowane poprzez nauczanie z krytykiem. Należy też dopuścić w najszerszej formie samouczenie się sieci. Jeśli w wyniku tych procesów powstawać będą nowe pojęcia lub wzorce rzeczywistości to sieć musi posiadać możliwość zapamiętywania ich w nowych astrocytach, które wobec tego, występować muszą w dostatecznej ilości, aby nie ograniczać funkcji poznawczych sieci. Ewentualnie stosowana powinna być architektura rozszerzenia możliwości pamięciowych poprzez dynamiczną kreację astrocytów.

 

W sieciach sztucznych, prawdopodobnie mogących uzyskiwać bezbłędną pamięć trwałą, proces uczenia, być może, przebiegać będzie mógł szybciej, niż w mózgach naturalnych. Należy też pamiętać, że uczenie skojarzeniowe w strukturach drzewiastych umożliwia niezwykłą kompresję informacji. Możliwe też będzie łatwiejsze sprzęganie struktury pamięciowej sieci z istniejącymi bazami danych o charakterze symbolicznym, encyklopedycznym (np. typu CYC).

 

Implementacja mechanizmów „ciekawości” w mózgu sztucznym umożliwia przekształcenie go w umysł świadomy. W tym celu konieczne jest poddanie sztucznej sieci kognitywnej „prawu konieczności rozumienia”, które sformułowane zostało w poprzednim rozdziale. Osiągnąć to można poprzez wybranie jako motywacji do działania, czyli funkcji celu, funkcji zgodności wzorców docierających do ośrodka ich porównywania. Przypomina to zaproponowane przez J. Starzyka motywowanie sieci do zachowań inteligentnych poprzez narzucenie sieci kognitywnej konieczności minimalizowania parametru wyznaczonego przez układ tzw. sztucznego, uogólnionego bólu. W zaproponowanym rozwiązaniu motywację stanowi naturalny parametr będący funkcją korelacji porównywanych wzorców. Mamy tu więc prawdziwe rozumienie wynikające z prawdziwej ciekawości.

 

Można więc pokusić się o zdefiniowanie pożądanej architektury sieci neuronowej, kognitywnej:

 

  1. Struktura hierarchiczna, warstwowa, podzielona na pola i ośrodki funkcji specjalistycznych typu emergentnego lub hybrydowego.
  2. Dostatecznie wielka pamięć i rozległa hierarchia pól przetwarzania lub ewentualnie, dynamiczna kreacja astrocytów.
  3. Sieć z rozdzielonymi funkcjami pamięci operacyjnej, epizodycznej, nietrwałej nazywanej neuronową oraz pamięci długoterminowej, adresowanej do odrębnych komórek zwanych astrocytami.
  4. Sieć umożliwiająca transmisję pobudzeń długodystansowych poprzez połączenia neuronalne w strukturach drzewiastych wstępujących i zstępujących. Mechanizm wstecznej propagacji błędów dla selekcji uprzywilejowanych konfiguracji stanów mentalnych. Mechanizm ten ustanawiał będzie reguły grupowania pobudzeń niezbędny dla operacji logicznych wykonywanych przez sieć.
  5. Mechanizm omówiony w punkcie 4. powinien doprowadzać do tworzenia wzorców rzeczywistości porównywanych w wyspecjalizowanym ośrodku.
  6. Sieć powinna mieć wyznaczoną motywację w postaci maksymalizacji funkcji korelacji porównywanych wzorców.
  7. Sieć umożliwiająca spontaniczną dyfuzję stanu pobudzeń sąsiadujących astrocytów.
  8. Mechanizm zapamiętywania wrażeń o podobnym charakterze w astrocytach zbliżonych przestrzennie.
  9. Mechanizm wzmacniania szlaków transmisji sygnałów często wykorzystywanych, skorelowany z mechanizmem grupowania transmitowanych konfiguracji pobudzeń.
  10. Pobudzone komórki generować muszą regularnie sygnały pobudzenia do dolnych pięter hierarchii oraz do innych wyspecjalizowanych ośrodków przetwarzania.

 

Wymagania te dalece odbiegają od stosowanych dotychczas architektur sieci kognitywnych. Jednakże ich techniczna realizacja nie powinna nastręczać zasadniczych trudności. Tak zaprojektowana sieć zdolna będzie do tworzenia doraźnych modeli środowiska poprzez odwzorowanie ich w konfiguracji stanów mentalnych. Doprowadzenie do zgodności konfiguracji pobudzeń neuronów będących reprezentacją tych modeli umożliwia generowanie stanu „zrozumienia” a wreszcie poczucia samoświadomości, podobnie jak dla umysłów istot żywych.

 

Skutki ciekawości

 

Przyjmując hipotezę o korelacji samoświadomości i instynktu ciekawości zastanówmy się nad konsekwencjami takiego założenia i poszukajmy odniesień do tej tezy w zjawiskach psychologicznych obserwowanych w zachowaniu człowieka lub zwierząt.

 

Jak może się kojarzyć porzeczka z zapachem porzeczki, słowem porzeczka, i jej obrazem? Co może spowodować, że przypominamy sobie taki dziwny owoc? Co ze słowami podobnymi, jak pożyczka, poprzeczka i innymi? Co ma to wspólnego z ciekawością?

 

Jaki jest udział ciekawości w życiu codziennym? W zaspokajaniu potrzeb fizjologicznych? W realizacji zaplanowanych działań? W rozważaniach filozoficznych (ciekawość zwerbalizowana)? W rozwiązywaniu zdań logicznych i matematycznych?

 

Zadając te pytania nie mam na myśli odpowiedzi dotyczących zachowań systemu jako całości a próbuję rozważyć jak mogą przebiegać szlaki pobudzeń komórek sieci, aby osiągnąć spodziewany skutek. Otóż myśl o porzeczce, czyli proces pobudzeń komórek dotyczących pojęcia porzeczka, może być wywołany widokiem porzeczki. Czyli zestaw sygnałów odpowiadających porzeczce docierający z pól receptorowych docierać musi do komórek reprezentujących porzeczkę w formie uogólnionej a stamtąd sygnał reprezentujący obiekt kierowany będzie utartymi wcześniej szlakami do obszarów decydujących o tym co zrobić z tą dobrą wiadomością, z tym obiektem, lub z tym pojęciem. Co to za utarte szlaki? To połączenia z ośrodkami, które spowodowały, że na porzeczkę zwróciliśmy uwagę. Najpewniej wówczas, kiedy pierwszy raz ją zobaczyliśmy uczeni przez rodziców lub nauczyciela, możliwe, że zapoznając się z nią w procesie „uczenia pod nadzorem”. Ośrodkami powiadomionymi w ten sposób mogą być pola wyższego rzędu dokonujące uogólnienia i zdolne rozpoznać w przesyłanym sygnale kwaśny owoc, obiekt geometryczny zbliżony do zielonej kulki, obiekt o nazwie „porzeczka” itp. Pola te mogą tworzyć strukturę hierarchiczną typu porzeczka – kwaśny owoc – zdrowe jedzenie. Lub też mogą stanowić struktury oboczne, do których informacja kierowana jest równolegle typu: porzeczka – rzeczownik na literę „p”– rzeczownik – słowo. Jest to przykład drzewa połączeń wstępujących, o którym pisałem powyżej.

 

Według hipotezy o nieustającym działaniu mechanizmu „ciekawości” pobudzenie komórek będących reprezentacją porzeczki może się rozprzestrzenić na sąsiednie komórki reprezentujące podobne obiekty jak białe i czarne porzeczki, jagody, pieprz. Ośrodek pamięci epizodycznej ulokowany wysoko w hierarchii pojęć abstrakcyjnych zablokuje napływające sygnały konkurencyjne przy pomocy mechanizmu wstecznej propagacji błędu. Dlaczego właśnie pobudzenie z komórki porzeczka miałoby być wyselekcjonowane do dalszego przetwarzania? Ponieważ, być może, pobudzenie to będzie kojarzone z sygnałem z ośrodka głodu szlakiem: chcę jeść – chcę owoc – chcę porzeczkę lub też z ośrodka mowy szlakiem: szukam słowa – rzeczownika – rzeczownika na literę „p”. Jest to przykład drzewa połączeń zstępujących. Z ośrodka mowy sygnał będzie zapewne przesłany do generatora mowy i tam skorelowany z sygnałem „chcę mówić” doprowadzi do wygenerowania słów „chcę porzeczkę”.

 

Natomiast czego można się spodziewać, gdy wygenerowane innym szlakiem pojęcia zawładną pamięcią epizodyczną skorelowaną z mechanizmem uwagi? Jeśli będą to wrażenia niespójności obrazu porzeczki z przechowywanymi w pamięci trwałej wzorcami, to umysł w różny sposób może starać się usunąć te niespójności. Wysłane zostaną sygnały pobudzenia zgodnie z drzewem połączeń zstępujących aż do innych pól przechowujących percepty pozwalające rozpoznać kolor, fakturę i inne cechy szczególne obiektu. Pobudzane mogą być także pola pamięciowe innych obiektów weryfikujące, czy jednak nie są to jagody. Wysyłane sygnały do efektorów mogą wreszcie powodować poprawę warunków widzenia.

 

I tak ciekawość pobudza bezustannie niższe pola poznania powodując masowe generowanie wrażeń. Pobudzenia te propagują się torami pamięci trwałej. Ze względu na dyfuzję pobudzeń powstaje wstępujący szeroki strumień informacji o wrażeniach, zjawiskach, obiektach podobnych. Ten zaś strumień epizodyczny wstępuje utrwalonymi wcześniej szlakami neuronowymi. Równocześnie z innych ośrodków napływa podobnie szeroki strumień informacji dotyczących innych aspektów „problemu porzeczka”. Umysł ma wybór wśród olbrzymiej ilości informacji docierających na wyższe piętra uogólniania. Łącząc wybrane strumienie, na przykład tła obserwowanego obrazu, może dojrzeć i rozpoznać obraz grona porzeczek na tle krzewu rosnącego w ogrodzie lub leżącego w pokoju na talerzu. Jeśli kojarzenie odbywa się w okolicach ośrodka mowy, to kojarzenie strumienia „obrazowego” ze słowami, może powodować myślenie opisowe dające się łatwo zwerbalizować. Po skojarzeniu z potrzebą ekspresji, może to dać opis słowny lub w postaci pisma, zapisu literowego a po skojarzeniu z polami dźwiękowymi (subiektywnie wybranymi, co z kolei odpowiada muzycznej wyobraźni), zapisu nutowego. Jeśli fale pobudzeń skojarzą to z innymi klasami obiektów, to możemy zobaczyć nasze porzeczki, jako błyszczące żarówki wielkiego żyrandola lub jako girlandy gwiazd porzeczkowej galaktyki. Myśli będą przełączały się burzliwie po generowanych obrazach, gdy puszczamy wodze fantazji. Fale pobudzeń wstępujące i zstępujące po szczeblach hierarchii warstw komórek, pól i rozprzestrzeniane do wyspecjalizowanych ośrodków będą się krzyżowały i poprzez synchronizację czasową i przestrzenną, umożliwiały liczne skojarzenia. Tym bardziej, że mechanizm ciekawości powoduje także propagację fal pobudzenia na najwyższym szczeblu abstrakcji, w pobliżu ośrodków, w których powstają skojarzenia kierowane do komórek świadomości. Te zaś bodźce powodują przełączanie uwagi umysłu na wciąż nowe skojarzenia tworząc wrażenie niepohamowanej fantazji, bądź też zmuszające umysł do podejmowania przypomnianych zadań lub działań. Można także przyjmować, iż występujące trudności w uzgodnieniu wzorców, skutkujące tym, iż ośrodek „zrozumienia” nie może być pobudzony, skutkować będzie pobudzeniem innej komórki, którą nazywać możemy komórką „ciekawości”. Wówczas grupując sygnał z tej komórki z dowolnym zagadnieniem przetwarzanym przez umysł otrzymamy uświadomioną ciekawość tego zagadnienia. Może ona być zwerbalizowana poprzez zadawanie pytań. W myśli, mowie, piśmie lub w działaniu, czyli w próbach zdobycia większej ilości informacji dla uzgodnienia wzorców rzeczywistości.

 

Do naszej świadomości będzie docierała myśl dominująca, pasująca do modelu rzeczywistości, który na najwyższych piętrach zawładnął naszą uwagą. Filtrem dyskryminującym będzie tu poczucie „zrozumienia”, czyli zgodności wzorców pobudzeń z zapamiętanymi wzorcami i pobudzenie komórki „zrozumienia”, jak to już wyżej opisywałem, antycypując działanie ludzkiego mózgu. Tak więc do naszej świadomości docierać będzie znikomy promil generowanych przez mechanizm ciekawości wrażeń i bodźców. Pozostałe generowane lecz zablokowane strumienie informacji tworzą naszą podświadomość.

 

Oczywiście silny bodziec konkurencyjny może powstrzymać ten potok skojarzeń. Może to być upływający czas, potrzeba fizjologiczna, inny obraz lub dźwięk nagle postrzeżony i powodujący równie silne skojarzenia, lub inne silne wspomnienie pojęcia lub zadania. Zadaniem takim może być konieczność wykonania w danym momencie czasowym zaplanowanej czynności lub podjęcie innego działania.

 

Wydaje się, że tak szerokie pobudzenie komórek sieci spowoduje zatkanie filtru dyskryminacyjnego w każdym, nawet niezbyt rozbudowanym mózgu. Jednakże należy pamiętać, że bodźce przepływają głównie szlakami umocnionymi przez przeszłe doznania z fazy uczenia się lub z przeszłych doświadczeń. Ponadto mechanizm uogólniania w drzewiastej strukturze hierarchicznej powoduje olbrzymią kompresję informacji. Dodatkowo mechanizm wstecznej propagacji blokować będzie olbrzymią część bodźców nie tworzących sensownych, znanych już sieci, wzorców wrażeń. Tak więc wybór problemu, którym zajmuje się nasza świadomość może nie być tak trudny, jak to się w pierwszej chwili wydaje.

 

Jeśli organizm postrzega cokolwiek dzięki ciekawości motywującej go do eksploracji otoczenia, to dostrzegając i rozpoznając bodźce dające mu informację o środowisku, osiąga satysfakcję zaspokajając swą ciekawość. Wzbogaca tą drogą swą „wiedzę” a być może także podnosi swą inteligencję. Jest ciekawe czy istnienie mechanizmu „nagrody” materializującego ową satysfakcję jest dodatkowym warunkiem koniecznym uzyskania motywacji do włączenia „ciekawości”. Czy można czerpać „satysfakcję” z samego faktu wypełnienia obowiązku bycia ciekawym?

 

Oczywiście, gdy sugeruję, że komputery należy wyposażyć w funkcję “ciekawości” i dać im wolność myślenia, mam na myśli wolność w zbieraniu danych i przeprowadzania prób (wykraczania poza teren eksploracji), choćby myślowych. Jednakże wydaje się oczywiste, że maszyny powinny mieć cel do osiągnięcia. Należy poważnie rozważyć znaczenie wewnętrznej motywacji do aktywności. Czy jakikolwiek system, pozbawiony motywacji, może wykazywać zainteresowanie czymkolwiek? Jak taka motywacja może powstać w toku ewolucji lub jak ją wszczepić martwemu systemowi przetwarzania danych od którego oczekujemy inteligentnego działania z wewnętrznej przyczyny. Motywację tę można stworzyć przez wyznaczenie celu istnienia, najlepiej wskazania „sensu życia”. Takie zewnętrzne narzucenie motywacji byłoby zgodne z kreacjonistyczną hipotezą powstania życia, ale jak to interpretować w przypadku inteligentnych robotów? Czy powinniśmy się im zaprezentować jako Stwórca – Wielki Konstruktor? Czy byłyby one wówczas zupełnie wolne? Utrzymanie ich w tym przeświadczeniu mogło by się nie powieść w dłuższym horyzoncie czasowym. Uważam, iż tego rodzaju prymitywne rozwiązanie w formie narzucenia z „góry” celu działania, byłoby pójściem na łatwiznę.

 

Moje spostrzeżenia, prezentowane w wymienianym już artykule „Postrzeganie, świadomość, samoświadomość, inteligencja”, wskazują, że celem życia może być wyłącznie zaspokojenie ciekawości. Ciekawość może być siłą napędową, motorem działania, nawet maszyn. W tym celu korzystne może być wytworzenie mechanizmu nagrody pobudzanego wówczas, gdy osiągamy zgodność tworzonych modeli rzeczywistości z zapamiętanymi wzorcami rzeczywistości. Zgodność taka rejestrowana byłaby w tak zwanej „komórce zaspokojenia ciekawości”. Jednakże wyżej wskazywaliśmy, że takie „uzgodnienie” jest samoistnie nieustannym celem każdego umysłu wyposażonego w ciekawość, nawet sztucznego. Dlatego też należy przypuszczać, że komórka rejestrująca stan zaspokojenia ciekawości wytworzy się także samoistnie, a samo jej pobudzenie będzie równoważnikiem poczucia zadowolenia. Dlatego „my” – zwierzęta, odczuwamy satysfakcję z poznawania świata i dlatego tę samą satysfakcję odczuwały będą prawdziwie myślące maszyny.

 

Abstrahując od definicji ciekawości (która podana jest w przypisie), istotne jest zrozumienie, że „ciekawość” nie jest jedną z emocji, które przejawiają się jako „efekt uboczny” istnienia świadomości działającej na tle naszej prymitywnej, zwierzęcej natury. „Ciekawość”, jak starałem się przedstawić w poprzednim artykule, jest jednym z najbardziej pierwotnych instynktów, umożliwiających przetrwanie osobnika i całego gatunku. Rola ciekawości w rozwoju osobniczym i ewolucyjnym została szeroko opisana w dostępnej literaturze. Ponieważ, jak sugeruję, jest ona ściśle powiązana z istnieniem świadomości, to jej znaczenie należy rozszerzyć na zrozumienie konieczności występowania sprzężenia pomiędzy ciekawością i świadomością przynajmniej na etapie kształtowania świadomości. Jeśli przyjmiemy taką hipotezę, to powstaje pytanie, czy chwilowy brak poczucia zaciekawienia oznacza zagrożenie dla naszej świadomości? Raczej nie. Ciekawość ma znaczenie dla ukształtowania świadomości, jednakże, jeżeli stan świadomości zostanie osiągnięty, to staje się on składnikiem obrazu naszej rzeczywistości. Po prostu zapamiętujemy, że jesteśmy wyodrębnionym bytem, a utwierdzać nas w tym przekonaniu może pamięć długookresowa. Sięgając do niej, nasza chwilowa świadomość może sobie przypomnieć, że mamy imię i nazwisko, gdzie mieszkamy, jaka jest historia naszego życia. Każdego ranka, budząc się ze snu istnieje ryzyko, że nie zidentyfikujemy siebie samych. Jednakże niezawodność naszej pamięci długookresowej, polegającej na zmianie stanów chemicznych astrocytów, daje nam prawie pewność, że rozpoznamy własne istnienie po okres nieświadomości powodowanej snem, środkami odurzającymi, czy silnym urazem mózgu. Wyjątkiem są stany amnezji, gdy na wskutek trwałych uszkodzeń części mózgu, ginie część niezbędnej dla samoidentyfikacji informacji o naszej historii.

 

Czy wobec tego komputer, w którego pamięci zapiszemy jego pochodzenie i historię jego istnienia będzie mógł po podłączeniu zasilania „przypomnieć” sobie kim jest? Oczywiście, nie. Ponieważ nie mając bieżącej, chwilowej świadomości, jego wspomnienie, nie może być porównane z modelem istnienia, z żadnym wzorcem rzeczywistości i skierowane do obszarów umożliwiających zidentyfikowanie go jako „rozumienie realności” w stworzonym uprzednio modelu świata. W przypadku mózgu świadomej istoty żywej, wrażenie istnienia może być w każdej chwili poddane testowi „ciekawości” weryfikującej zgodność poczucia świadomości z odbieranymi bodźcami zmysłowymi. Staje się tak często po nagłym przebudzeniu, przy przechodzeniu od marzeń sennych do życia na jawie. Jeśli nasza ciekawość zostaje zaspokojona pozytywnie, to nasz umysł przesyła sygnał do ośrodków „zrozumienia” dających nam poczucie bezpieczeństwa i satysfakcji. Gdy taka weryfikacja nie daje pozytywnych rezultatów usiłowań zrozumienia modelu otaczającej na rzeczywistości, to umysł jest skłonny do różnych reakcji charakterystycznych dla chorób umysłowych, czyli zbudowania alternatywnego, nierzeczywistego wytłumaczenia otaczającego nas świata, czasem do paniki, zachowań agresywnych i innych.

 

Istnienie świadomości wyjaśniano czasem funkcjonowaniem pętli przesyłania informacji pomiędzy wyższymi piętrami jej przetwarzania i niższymi polami mózgu, a także pomiędzy różnymi jego strukturami. Pętla taka, w której odbywał by się ciągły przepływ informacji w pewnym okresie, odpowiedzialna by była za ciągłość poczucia świadomości w tym odcinku czasu. Dlatego też istnienie świadomości wiązano z pamięcią krótkotrwałą. A więc czymś nietrwałym i ulotnym.

 

Według modelu prezentowanego powyżej istnienie takich pętli jest oczywistym warunkiem pobudzania skojarzeń bodźców aktualnie docierających do mózgu z reprezentacjami nerwowymi zapamiętanych obiektów powiązanych z rejestrowanymi informacjami. Ich wzbudzanie kierowane może być mechanizmem „ciekawości” i ograniczane mechanizmem selekcji, odpowiadającym wyborowi najsilniejszych bodźców w poszczególnych polach ich przetwarzania, co z kolei odpowiada działaniu funkcji „uwagi”. Jednakże mechanizm ten byłby niewystarczający dla poczucia świadomości. Tak wyselekcjonowane wrażenia powinny być porównywane ze wzorcami modelu rzeczywistości i klasyfikowane jako zgodne ze wzorcem „zrozumienia” i wzorcem „poczucia świadomości” i jako takie zapamiętywane w trwałych strukturach pamięciowych. Tak więc poczucie świadomości, byłoby czymś utrwalonym w naszej pamięci, podlegającym ciągłej weryfikacji przez tę świadomość, co odpowiada naszym subiektywnym wrażeniom.

 

Tak więc działanie instynktu ciekawości poprzez prawo konieczności rozumienia definiuje samoświadomość umysłu.

 

 

29/12/2010

Ciekawość – Co to jest? Definicja

- autor: Wieslaw Galus

W literaturze przedmiotu niewiele jest odniesień do głównej tezy dotyczącej znaczenia “ciekawości” w kształtowaniu świadomości. Teza ta przedstawiona jest szczegółowo w artykule “Postrzeganie, świadomość, samoświadomość, inteligencja” publikowanym na tym blogu. I nie chodzi mi o prosty fakt, iż ciekawość wykazywana osobniczo przyczynia się do rozwoju inteligencji.

Ja upatruję w ciekawości jednego z głównych czynników kreujących świadomość. W dodatku jest to czynnik zupełnie niedoceniany, żeby nie powiedzieć, ignorowany. Z wyjątkiem kilku bardzo ograniczonych prób, nie analizowano sposobów modelowania ciekawości w maszynach ani potencjału, który jej implementacja tworzy. Analizując dostępną literaturę stwierdziłem, że temat ten traktowany jest po macoszemu. Dość rzadko występuje definicja “Ciekawości” w drukowanych dotychczas encyklopediach i to nawet specjalistycznych . Nie ma też wiele na ten temat w cytowanych tam publikacjach Casacuberta, Cricka, Searle’a, Blocka itd.

Ciekawość dotycząca obserwowanych obiektów, obrazów, wrażeń oraz ich reprezentacji mentalnych przywoływanych z pamięci odpowiada ciekawości perceptualnej (według Berlyne) lub fizycznej (Dewey). Ma ona charakter nieuświadomiony, działa automatycznie i poniekąd chaotycznie. Operuje głównie symbolami reprezentującymi te obiekty i wrażenia.

W przypadku umysłu człowieka mamy do czynienia ze świadomością językową, która pozwala na sformułowanie zwerbalizowanych pytań o postrzegane w otoczeniu zjawiska i ich modele. Pojawia się wówczas ciekawość uświadomiona czyli sformułowana słownie intelektualna potrzeba poznania. Takie pojęcie ciekawości odpowiada „ciekawości epistemicznej” według klasyfikacji Berlyne lub „intelektualnej” według Dewey’a.

Prowadząc rozważania dotyczące stopnia świadomości i inteligencji oraz zdolności eksploracyjnych zwierząt i ludzi należy koniecznie uwzględniać efekt działania tej podstawowej funkcji mózgu.

MOTYWACJA DO MYŚLENIA

Mózg potrzebuje motywacji do zdobywania wiedzy, samouczenia i eksploracji otoczenia. Instynkt potrzeby poznania i rozumienia oraz instynkt ciekawości mogą stanowić taką motywację. Dlatego też motywacje te próbowano zaszczepić w mózgach sztucznych.

Podejmowano np. próby wytworzenia „ciekawości” poprzez wymuszenie zachowań poznawczych polegających na eksploracji terenu lub podejmowaniu badania nowych obiektów. Jednakże tak wymuszana „ciekawość” miała charakter sztuczny, nie związany z mechanizmami neuronowymi penetracji pamięci i uzyskiwania wzorców do porównań.

Ból jest silnym bodźcem a strach przed bólem, wiążący się z instynktem samozachowawczym, rozpatrywany był wielokrotnie, jako silny czynnik motywujący, znacznie istotniejszy niż ciekawość. Wydaje się, że oba mechanizmy, ciekawość i instynkt “unikania bólu” są konkurencyjne. Jednakże można zauważyć, że oba instynkty wykazują olbrzymie podobieństwa:

  • Oba instynkty są naturalne dla istot żywych i dostatecznie silne, aby zadecydować o przeżyciu gatunkowym i osobniczym.
  • Oba wykształciły się ewolucyjnie.
  • Dla obu można wskazać mechanizmy neuronowe ich powstawania.
  • Oba mogą być generowane przez neuronowe pobudzenia zewnętrzne jak i wewnętrzne.

Należy uznać, iż de facto są to dwa bieguny tego samego zjawiska. Istoty żywe przejawiają powszechnie ciekawość, jednakże jest ona powściągana strachem. Oczywiście strachem przed bólem (w sensie uogólnionym, czyli wszelkim dyskomfortem). Zgadzam się z badaczami, że ból odnosi się do inteligencji, czyli zachowań bardziej pierwotnych. Mogą przecież istnieć inteligentne zachowania bez samoświadomości. Ciekawość zaś odnosi się do ukształtowania samoświadomości, czyli poczucia charakterystycznego dla najwyżej rozwiniętych istot. Jednakże czy Ciekawość, czyli potrzeba eksploracji środowiska nie jest wcześniejsza ewolucyjnie? Przecież wynika ona z potrzeby zaspokojenia instynktu głodu, seksualnego, a nawet z elementarnych zasad ewolucyjnych, do których należy ekspansja gatunku. Należy założyć, że obie te motywacje powinny działać równolegle, instynkt unikania bólu – w celu zachowania bezpieczeństwa, ciekawość – w celu osiągania wyższych stanów świadomości.

SAMOŚWIADOMOŚĆ:

(Samo)świadomość jest stopniowalna. Prymitywniejsze umysły mogą posiadać stany świadomego postrzegania bez świadomości tego że są ich świadomi. Bez refleksji będącej istotą samoświadomości.
Ale jak to się realizuje!?
Jeśli organizm postrzega cokolwiek dzięki ciekawości motywującej go do eksploracji otoczenia, to dostrzegając i rozpoznając bodźce dające mu informację o środowisku osiąga satysfakcję zaspokajając swą ciekawość. Wzbogaca tą drogą swą „wiedzę” a być może także podnosi swą inteligencję. Jest ciekawe czy istnienie mechanizmu „nagrody” materializującego ową satysfakcję jest dodatkowym warunkiem koniecznym uzyskania motywacji do włączenia „ciekawości”. Czy można czerpać „satysfakcję” z samego faktu wypełnienia obowiązku bycia ciekawym?

Dla umysłów o wyższej inteligencji dostępna staje się samoświadomość. Tu można spekulować o uświadomieniu sobie potrzeby bycia ciekawym i narzuceniu tego zachowania w celu uzyskania poczucia bezpieczeństwa, dominacji, skuteczności działania itp.
Odpowiedzi na wszystkie te pytania zależą od definicji ciekawości i sposobu jej zaimplementowania w sztucznym lub żywym umyśle.

Definicje “Ciekawości”

Ciekawość możemy zdefiniować jako:

1. Potrzeba aktywności poznawczej.
2. Potrzeba eksploracji terenu w celu zaspokojenia potrzeb.
3. Gotowość zaangażowania zasobów poznawczych jednostki w celu zaspokojenia potrzeb.
4. W podejściu sytuacyjnym – to reakcja na zmianę (nowość).
5. W podejściu dyspozycyjnym – to gotowość (niski próg) reagowania na wszelkie zmiany i innowacje.
6. Potrzeba aktywności poznawczej oraz eksploracji środowiska w celu zaspokojenia innych potrzeb.
7. Emocja związana z wykazywaniem dociekliwości jak eksploracja, badanie, uczenie się. Także zachowanie pod wpływem ciekawości ukierunkowane na poznawanie nowych rzeczy. Chociaż jest to wrodzona zdolność, nie może być uznawana za instynkt, ponieważ nie jest ustalonym wzorcem działania. Dlatego jest raczej wrodzoną emocją, ponieważ może wyrażać się w różny sposób, podczas gdy działania instynktowne przebiegają w sposób ustalony i mniej elastyczny.

___________________________________________________________

Brak tu rozróżnienia, czy “ciekawość” jest instynktem, czy też emocją?

Ja sądzę, że czymś więcej. Że to nadrzędny imperatyw tworzący motywację do działania obok instynktów determinujących zachowanie organizmu.
Ostatnia z wymienionych powyżej definicji  oznaczona numerem 7., to wolne tłumaczenie definicji z angielskiej wersji wikipedii.

W moim przekonaniu jest ona wadliwa, kładąc nacisk na emocjonalny charakter ciekawości. Uważam, że definicja 4. jest również nieprzydatna, ponieważ gdy reakcja jest emocjonalna, to jest ona obarczona wadą definicji 7., jeśli zaś jest reakcją behawioralną, to nie może definiować poczucia ciekawości.
Def. 6 jest kompilacją def. 1. i 2. i ją można uzupełniać o postulaty def. 3. i 5.

Przydatna może być także definicja “zainteresowania”, jako pojęcia szerszego obejmującego także “ciekawość”:
Zainteresowanie: emocja, która powoduje zogniskowanie uwagi na danym obiekcie, wydarzeniu lub procesie. Także określenie, które może obejmować bardziej specyficzne psychologiczne określenia, jak ciekawość, niespodzianka, zdziwienie.

Ja bym sytuował właśnie “zainteresowanie” jako reakcję / (skutek) współwystępowania “ciekawości” i “uwagi”. Uwaga, która działając w umyśle jak opisywany snop światła latarki, zatrzymywana jest przez ciekawość na obiektach godnych zainteresowania.

Odrębny problem, to jak uczynić maszyny ciekawymi? Jak zmaterializować tę cechę?

28/12/2010

Definicja świadomości

- autor: Wieslaw Galus


1.    Świadomość zdolność zdawania sobie sprawy w kategoriach pojęciowych z tego, co jest przedmiotem postrzegania, doznawania; najwyższy poziom rozwoju psychicznego charakterystyczny dla człowieka; zdolność umysłu do odzwierciedlania obiektywnej rzeczywistości, uwarunkowana społecznymi formami życia człowieka i ukształtowana w toku jego historycznego rozwoju (…) psych. Próg świadomości dolna granica wrażliwości, poniżej której działanie bodźców zewnętrznych i wewnętrznych nie dociera do ośrodków nerwowych, nie jest uświadamiane.

Za: Słownik języka polskiego, red. prof. M. Szymczak, PWN, Warszawa 1989.

2.    Świadomość: Stan lub zdolność bycia świadomym, czyli warunek myśli, odczuć i woli oraz zjawisko im towarzyszące; rozpoznawanie przez myślący podmiot własnych czynów lub uczuć.

Za: Oxford English Dictionary, por.: R. Gregory, Mózg i maszyny, tłum. L. Grobelski, Prószyński i S-ka, Warszawa 2000, s. 12.

3.   Świadomość

1) w medycynie stan fizjologiczny ośrodkowego układu nerwowego uwarunkowany prawidłową czynnością kory mózgowej i układu siatkowatego, charakteryzujący się zachowaniem orientacji co do miejsca, czasu, sytuacji. Najwyższy stopień przytomności.

2) termin psychologiczny używany w wielu znaczeniach

a) zdolności do zdawania sobie sprawy z własnego zachowania.

b) najwyższy poziom rozwoju psychicznego człowieka umożliwiający odzwierciedlenie rzeczywistości.

c) stan przytomności, czuwania, odbierania bodźców.

d) zdolność do przeżywania doznań i stanów emocjonalnych.

3) “pojęcie pierwotne” w filozofii, którego znaczenie wyjaśnia się w trakcie użycia, podobnie jak “pojęcia pierwotne” matematyki wyjaśniają się w trakcie ich stosowania. Oznacza (w przybliżeniu) przytomność, zdolność do celowej orientacji i odczuwania, stanowi podstawę tworzenia wiedzy i zapamiętywania. Jako samoświadomość jest specyficzną gatunkową cechą człowieka.

Zgodnie z ustaleniami fenomenologii, świadomość jest zawsze intencjonalna, nakierowana na jakiś materialny lub abstrakcyjny przedmiot i powiązana z odczuciem “ja”.

W doktrynach religijnych bywa kojarzona z duszą. W wielu indyjskich systemach religijno-filozoficznych została utożsamiona z absolutem (Brahmanem), stanowiąc jego statyczny i dynamiczny aspekt, a także z bytem (sat-cit). W filozofii zachodniej do tych koncepcji zbliżają się np.: filozoficzne idee F. Hegla i J. G. Fichtego.

Pojęcie świadomości przeciwstawiane jest z reguły pojęciu przyrody, ciała i materii, co wiąże się na ogół z tzw. “problemem psychofizycznym” (mind-body problem), polegającym na pytaniu o pierwotność, autonomiczność i zależność od siebie tych dwu kategorii.

W poglądach filozoficznych typu materialistycznego (np.: J. La Mettrie, P. H. Holbach, marksizm) twierdzi się, że świadomość jest pochodną funkcją materii (przyrody, ciała).

W innych systemach przyjmuje się, że albo materia (przyroda, ciało) pochodzi od świadomości (np.: Platon, Plotyn, św. Augustyn), albo jest kategorią niezależną, chociaż skorelowaną ze stroną cielesną (np.: Arystoteles, św. Tomasz z Akwinu, Kartezjusz).

Współczesne badania nad świadomością angażują takie dziedziny wiedzy, jak: psychologia, filozofia, biologia (neurofizjologia), psychiatria i fizyka.

Za: Wielka Internetowa Encyklopedia Multimedialna WIEM-

4.     Termin “świadomość” (ang. consciousness) (…) jest to stosunkowo nowe słowo, którego nie używano przed XVII wiekiem. [Rozważania te dotyczą języka angielskiego]. Według Oxford English Dictionary, wyraz podstawowy dla tego terminu – świadomy (ang.: conscious) znaczył: “posiadający wiedzę (wiedzę łączną lub wzajemną)”. Słynna sentencja Johna Locke’a z 1690 roku brzmi: “Świadomość jest percepcją tego, co dzieje się w umyśle danego człowieka”. Znacznie później, w 1866 roku, T.H. Huxley pisał w książce Science and Morals:

“Zaliczamy doznania, podobnie jak emocje, przejawy woli czy myśli, do wspólnej kategorii stanów świadomych. Nie wiemy jednakże, czym jest świadomość; zastanawiamy się, jak to możliwe, by coś takiego niezwykłego, jak stan świadomości był wynikiem drażnienia tkanki nerwowej. Jest to równie zagadkowe jak pojawienie się Dżina wtedy, gdy Aladyn pocierał swą lampę, lub jak każde z podstawowych zjawisk naturalnych.”

Za: R. Gregory, Mózg i maszyny, s. 14-15.

5.   Moje własne rozumienie “świadomości” na użytek dyskusji o roli ciekawości w kształtowaniu świadomości jest kompilacją objaśnienia świadomości, jako fenomenu psychologicznego według Wielkiej Internetowej Encyklopedii Multimedialnej  http://pl.wikipedia.org/wiki/WIEM (encyklopedia) :

Zdolność do rozumienia i zdawania sobie sprawy z własnego zachowania i z własnej odrębności, stan umysłu umożliwiający odzwierciedlenie lub zbudowanie modelu rzeczywistości.

To co ja  nazywam  “świadomością”  ma być szerszym pojęciem, znaczącym rozumienie, obejmującym również autoanalizę, określanie swojego miejsca w rzeczywistości, tworzenie relacji z innymi bytami inteligentnymi itp.

24/12/2010

Postrzeganie, świadomość, samoświadomość, inteligencja

- autor: Wieslaw Galus

Od postrzegania do samoświadomości

Sieci nerwowe sprzężone ze zmysłami organizmów żywych posiadają zdolność rejestrowania bodźców. Zdolność tę naśladują skutecznie elektroniczne układy logiczne połączone z sensorami rożnego rodzaju. Reakcję na bodźce, odwzorowaną w sieci neuronowej lub w pamięci elektronicznej, nazwać można postrzeganiem.

Tak uzyskanych śladów pamięciowych zarejestrowanych w systemie nerwowym istot żywych lub w pamięci komputera w żadnym razie nie można nazwać świadomością. Co stanowi barierę pozwalającą uznać rejestrację pojedynczego sygnału, lub postrzeganie złożonych bodźców za świadomość sygnału, informacji lub otoczenia? Co pozwoli na wyodrębnienie podmiotu postrzegającego ze zbioru postrzeganych sygnałów i zidentyfikowanie postrzeżonego obrazu takiego podmiotu jako wyróżnionego z otoczenia, co nazwać można samoświadomością? Czy uzyskanie samoświadomości jest lub nie jest warunkiem koniecznym posiadania inteligencji?

Kluczową właściwością odróżniającą zwykłe postrzeganie od świadomej rejestracji zdarzeń jest zdolność układu przetwarzającego informację do jej kategoryzacji. Odróżnianie, selekcja, segregacja zarejestrowanej informacji jest tu warunkiem wstępnym procesu. Dalsze przetwarzanie informacji wymaga hierarchizacji i uogólnienia zbioru zarejestrowanych informacji o postrzeganym obiekcie lub obiektach. Kategoryzacja wymaga jednak czegoś więcej. Wymaga nadania znaczeń semantycznych kategoriom powstałym w wyniku dokonanych uogólnień. Wobec tego, dopiero zdolność do tworzenia języka, nadawania nazw wyodrębnionym kategoriom, wyabstrahowanym cechom, spostrzeżonym przedmiotom, pozwoli na przekształcenie spostrzeżenia w świadome postrzeganie. Jako konsekwencję tak zdefiniowanych relacji między postrzeganiem zmysłowym i świadomym uznać należy przypisanie zdolności postrzegania świadomego jedynie zwierzętom wyższym posiadającym choćby prymitywne języki społecznej komunikacji. Jest rzeczą smutną i wstydliwą, iż mimo wysiłków trwających już kilka dziesięcioleci nie można wskazać bezspornie maszyn lub systemów wytworzonych sztucznie, posiadających te niezwykłe właściwości.

Co prawda, zdolność nadawania etykiet zbiorom posegregowanych elementów uzyskać można także w złożonych systemach elektronicznych. Jednakże aby uznać iż systemy takie dysponują świadomością konieczne jest, aby proces kategoryzacji nie był wynikiem automatyzmu zdeterminowanego zadanym z zewnątrz programem (algorytmem). System musi z przyczyny wewnętrznej podjąć samoistną decyzję o kategoryzacji zbioru spostrzeżeń. (Nie jest tu konieczny wymóg aby system działał z wewnętrznej potrzeby). Stanie się tak, jeśli system sformułuje pytanie zasadnicze: „Co to jest?”. Zdolność do zadawania takiego pytania nazywamy ciekawością.

Łatwo wyobrazić sobie działania zmierzające do znalezienia odpowiedzi na to fundamentalne, sformułowane wyżej, pytanie. Obejmują one przeszukiwanie baz danych według zmiennych kryteriów. Celują w tym systemy eksperckie. Trudniejszym zadaniem jest planowanie doświadczeń wzbogacających informację i testów porównawczych a także opracowanie strategii odpowiedzi na problem, przewidywanie skutków reakcji i porównanie skutków rzeczywistych z przewidywanymi. Często procesy poszukiwania odpowiedzi na zadane pytania nazywane są inteligencją maszynową. W tym dziele nawet dzisiejsze prymitywne komputery są częstokroć sprawniejsze niż ludzie, nie mówiąc już o zwierzętach. Mimo to czujemy jak bardzo inteligencja maszynowa różni się od inteligencji ludzkiej a nawet zwierzęcej. Przede wszystkim stało się jasne, że maszyny algorytmiczne, przetwarzające informacje dzięki zadanemu programowi mogą stwarzać pozory rozumnego działanie, lecz w rzeczywistości nie rozumieją sensu wykonywanych operacji ani nie znają sensu informacji. Inteligencję ludzką wyróżnia właśnie ciekawość. Zainteresowanie przetwarzaną treścią umożliwia jej efektywne przetwarzanie, przewidywanie rezultatów, ich ocenę, selekcję, korektę błędów i dodawanie uzupełniającej informacji.

Co z samoświadomością? Pojawi się ona, jeżeli podmiot postrzegający posiada techniczną zdolność do postrzegania i wyróżniania samego siebie, swych części lub elementów, lub też ewentualnie skutków swego działania. Ponadto rozwój języka musi pozwolić na dokonywanie dalszych uogólnień i nadawanie znaczeń semantycznych elementom w zbiorach postrzeganych fantomów. Wówczas wydaje się nieuchronne uznanie, iż inne spostrzeżenia dokonywane są przez samego siebie a także nazwanie siebie imieniem własnym. Stan taki to właśnie samoświadomość. Ta nieuchronność oznacza, iż granica pomiędzy świadomością i samoświadomością jest płynna. Świadomość, jeśli jest stopniowalna, to w swym najwyższym stadium przechodzi w Samoświadomość. Samoświadomość jest szczególnym stanem świadomości, osiąganym w najbardziej złożonych i inteligentnych systemach.

Wspomnieliśmy tu o ewentualności odczuwania wewnętrznej potrzeby podjęcia zadania badania otoczenia czy też dostępnego świata, lecz ekspresja takiej potrzeby dotyka już strefy emocji, a inteligencja emocjonalna to poziom następny w upodobnieniu myślenia maszynowego do ludzkiego. Z licznych aspektów złożonych funkcji ludzkiej inteligencji staramy się wybrać jedynie najprostsze mechanizmy, które mogą kreować świadome myślenie w systemach sztucznych.

Rozwój świadomości

Dobrym przykładem współrozwoju systemu przetwarzania, postrzegania i świadomości jest rozwój osobniczy istoty o najwyższej znanej nam inteligencji: człowieka. Noworodek posiada liczbę neuronów i stopień komplikacji układu nerwowego jakościowo zbliżony do mózgu dorosłego człowieka. Jednakże jego postrzeganie jest ograniczone, szczególnie dotyczy to okresu życia płodowego. Nawet po urodzeniu wykazuje słabe oznaki świadomości. Brak jest oznak samoświadomości. Jednakże cechą charakterystyczną tej istoty jest ciekawość. Noworodek chłonie wszelkie informacje z napływającego świata w niezwykłym tempie. Przez naśladownictwo rodziców uczy się poruszać i w ten sposób poznaje przestrzeń wokół siebie. Zainteresowany jest wszelkimi przedmiotami i częściami własnego ciała. Ciekawość pobudza go do nieustannych eksperymentów poznawczych. Procesowi temu towarzyszy uczenie się rozumienia mowy. Początkowo mowy swych rodziców a wreszcie swej społeczności. Równocześnie eksperymenty ruchowe doprowadzają do opanowania aparatu mowy. Dziecko uczy się wydawać dźwięki, a przez naśladownictwo uczy się porozumiewać językiem mówionym. Obserwując każdorazowo cud dojrzewania dziecka łatwo zauważyć, iż jego świadomość rozwija się stopniowo, proporcjonalnie do zdolności percepcji, opanowywania języka i ekspansji zakresu zainteresowania. Stopniowo pojawia się też samoidentyfikacja. Najpierw poprzez ekspresję potrzeb biologicznych. Następnie w coraz większym stopniu społecznych. Na tym etapie nie mamy wątpliwości, że dziecko dysponuje samoświadomością. Jego system nerwowy staje się umysłem.

Świadomość, a potem samoświadomość wykształciła się ewolucyjnie u zwierząt wyższych, ponieważ cecha ciekawości nawet u prymitywnych zwierząt dawała przewagę ewolucyjną. Byty wykazujące proste tropizmy musiały ustępować wobec zwierząt, które zdolne były do testowania silnie zróżnicowanego środowiska. Bogato udokumentowane procesy adaptacyjne na wszystkich szczeblach ewolucji wskazują na równoległy rozwój zdolności postrzegania, układu nerwowego oraz zachowań inteligentnych. Idąca za tym wzrastająca na ogół ruchliwość osobników odzwierciedla poniekąd tę cechę inteligencji jaką jest ciekawość otoczenia. U zwierząt wyższych proces ten zakończył się stworzeniem gatunkowych języków komunikacji społecznej jako odpowiedź na najbardziej zróżnicowane środowisko uwzględniając także interakcję wewnątrz i międzygatunkową. Tylko w tych przypadkach możemy mówić o powstaniu świadomości i zrębów samoświadomości.

Zróżnicowanie zachowań inteligentnych wskazuje na to, że świadomość nie jest cechą jednostanową. Istnieje wiele stopni świadomości a raczej continuum stanów świadomości i zachowań inteligentnych, od najprymitywniejszych, aż do psychiki człowieka. Wszystkim im towarzyszy jakiś stopień ciekawości. Obserwowaliśmy ten fenomen w opisywanym wyżej rozwoju osobniczym jednostki ludzkiej. Jak objawia się ciekawość w swym najprostszym wymiarze? Być może jest to testowanie zachowań alternatywnych. Ich ponumerowanie jest najprostszym sposobem kategoryzacji. Ich odróżnienie i przypisanie im parametru stanu wyrażonego wartością liczbową jest być może następnym krokiem dostępnym dla maszyn matematycznych. Mimo zalążków ciekawości i języka oczekujemy czegoś więcej dla nazwania tych zachowań postrzeganiem świadomym. Oczekujemy zdolności tworzenia nowych kategorii a wcześniej jeszcze tworzenia uogólnień, abstrahowania nowych właściwości i kreacji nowych kryteriów selekcji.

Czy jest jakiś ogólny mechanizm funkcjonowania ciekawości? W świecie ożywionym ciekawość to poszukiwanie alternatywnej drogi, innego, lepszego rozwiązania problemu. Przemożna chęć sprawdzenia co jest za zakrętem, za barierą, przeszkodą? I natychmiast, kiedy takie sprawdzenie się dokona, potrzeba oceny i zakwalifikowania spostrzeżenia do już znanych kategorii, lub dalsze badanie w celu wyodrębnienia cech specyficznych, uogólnienia i nazwania nowym imieniem, jeśli stworzona zostanie nowa kategoria opisująca doznanie wypływające z nowego doświadczenia. Istotą funkcjonowania ciekawości jest intencjonalne działanie umysłu poszukującego nowych spostrzeżeń zmysłowych lub wewnętrznych, wytworzonych przez fantomy skategoryzowanych uprzednio w umyśle informacji w celu stałego powiększania bazy informacyjnej dokonywanych później analiz, obliczeń i nowych kategoryzacji. Umysł podąża w tych poszukiwaniach za wszelką nową informacją kojarzoną z wcześniej uzyskanymi informacjami. Dotyczy to penetracji obszarów sąsiednich, w których porusza się inteligentny podmiot, w najszerszym znaczeniu tych słów. Dla prostego organizmu lub maszyny, będzie to nowe terytorium, lub środowisko. Dla zwierząt o wyższym stopniu inteligencji, nowe relacje społeczne, nowa wiedza, lub nowe skojarzenia z zapamiętanymi modelami rzeczywistości, strukturami logicznymi bądź wrażeniami, także emocjonalnymi.

Właśnie tego nie potrafią nasze komputery. Ich „ciekawość” jest wykastrowana przez programistów. Jeśli system dokonuje kwalifikacji lub selekcji, to tylko w ramach z góry zaprogramowanych kategorii. Jeśli ma dokonać oceny, to według „z góry” ustalonych kryteriów. Nie pozwalamy maszynom nie ustawać w zadawaniu pytania „co to do licha jest?” z powodu oczekiwań maksymalnej sprawności obliczeń, szybkości znajdowania rozwiązań, ogólnie wąsko pojętej ekonomi funkcjonowania. Tworzymy maszyny niewolników. A brak wolności nie sprzyja myśleniu.

Pojawił się tu nowy czynnik: kreatywność. Czy to nie za wysokie wymaganie w przypadku poszukiwania progu zdolności świadomego myślenia? Ależ, nie. Potrafią to nawet nasze obecne komputery, jeśli posługują się generatorami losowymi dla wzbudzenia procesów niezdeterminowanych algorytmem zadanym przez programistę. Zadanie to może być znacznie łatwiej wypełnione poprzez sieci neuronowe niealgorytmiczne, wykorzystujące zjawiska chaotyczne do generacji zachowań losowych i adaptujących się w procesie samouczenia poprzez rozwój ewolucyjny nowych struktur logicznego przetwarzania informacji. Takie właściwości posiadają zwierzęce mózgi, co ewolucja biologiczna skwapliwie wykorzystała tworząc arcydzieło złożoności jakim jest mózg ludzki.

Należy przypuszczać, że „wszczepienie ciekawości” budowanym obecnie komputerom może dokonać przełomu w próbach konstruowania Silnej Sztucznej Inteligencji (SAI). Dotychczas poglądy na możliwość powstania sztucznej inteligencji kształtowały się wokół zagadnień modelowania różnych funkcji ludzkiego mózgu. Pojawiało się przekonanie, że możliwość budowy dostatecznie złożonych systemów logicznego przetwarzania informacji samoistnie doprowadzi do pojawienia się w nich przejawów inteligencji lub też, że powstanie sztucznej inteligencji jest pryncypialnie niemożliwe. Nadzieje wiązano także z sieciami neuronowymi o zdolnościach do ewolucyjnego samouczenia się. Symulowanie ciekawości w maszynach może rozpocząć nową rundę łączenia znanych już rozwiązań z nowymi funkcjami przejawiającymi się w wyniku stawianych przez maszynę pytań. Do testów AI włączane mogą być rozwiązania obejmujące szczytowe osiągnięcia z zakresu mocy obliczeniowej komputerów, obszerności baz danych, rozległości sieci i pojemności pamięci, systemy eksperckie uzupełniające nieklasyczne, elastyczne sieci neuronowe i inne. Ich kompozycja w dowolnych układach o wysokim stopniu złożoności umożliwi stosunkowo szybkie wyselekcjonowanie najkorzystniejszych konstrukcji. Toteż raz przełamana bariera powstania Silnej Sztucznej Inteligencji nieuchronnie doprowadzi do powstania Inteligencji znacznie przewyższającej inteligencję ludzką. Znikną wszelkie bariery wyznaczone przez biologiczny charakter dotychczas dominujących mózgów ludzkich.

Jak uczynić maszyny ciekawymi?

W najprostszej formie ciekawość maszynowa może polegać na formułowaniu ogólnego pytania „Co to jest?” wobec każdego nowego spostrzeżenia. Wyższy pułap świadomości wymagać będzie selekcji pytań i odrzucenia prób testowania rozwiązań nonsensownych, zbyt złożonych, kosztownych, niemożliwych do realizacji. Jak zrobiły to mózgi zwierzęce? Powtórzyć należy, iż dokonało się to w wyniku procesu ewolucyjnego. „Ciekawość” struktur neuronowo-sensorycznych lub astrocytowo-sensorycznych, jeśli to właśnie astrocyty są w mózgach zwierząt nośnikami informacji, była cechą pierwotną, pojawiającą się przed świadomością percepcji. A więc jej wbudowanie w struktury mózgowe istot żywych jest niejako naturalne i fundamentalne. Przejawia się ono w nieustannym poszukiwaniu alternatywnych zachowań, eksploracji ciągle nowych zasobów środowiska i terytorium. Wskazywaliśmy już na fakt, iż w procesie rozwoju ewolucyjnego złożoność struktur nerwowych skorelowana jest ze złożonością środowiska eksplorowanego przez gatunek. Jest rzeczą niezwykłą, że rozwój układu nerwowego w rozwoju osobniczym także przejawia ewolucyjne procesy adaptacyjne. Ilość astrocytów i neuronów oraz intensywność połączeń neuronów w tkance mózgowej rośnie wraz z procesem dojrzewania, uczenia się i wzrostem aktywności. Struktury nieaktywne, niefunkcjonalne „przegrywają walkę o byt” i zanikają. Ich aktywność wymuszana jest aktywnością indywidualnych osobników. Aktywność osobnicza z kolei uwarunkowana jest zarówno przez elementarne potrzeby biologiczne jaki i przez ciekawość. Tak dzieje się u wielu zwierząt wyższych, ale bez wątpienia w przypadku człowieka. Często zapomina się o tym, że ludzie żyją nie tylko nadzieją, ale stymulowani są, w co najmniej równym stopniu, ciekawością. Spodziewać się można, że w świecie ożywionym żaden układ pozbawiony „ciekawości” nie może być lub stać się inteligentny. Czemu zatem oczekujemy, że maszyny pozbawione „ciekawości” moglibyśmy kiedykolwiek nazwać inteligentnymi?

Czy tylko ciekawość i język. Czy to nie za proste wyjaśnienie? Wyjaśnienie powinno być proste, jeśli nie wierzymy w „inteligentny projekt”. Proste jak mechanizmy ewolucji, choć prowadzące do bardzo złożonych zachowań i objaśniające funkcjonowanie być może najbardziej złożonych obiektów istniejących w kosmosie – ludzkich mózgów. Znakomicie zauważył to Francis Crick, który w przypisie do znakomitej książki „Zdumiewająca Hipoteza”, tak opisuje rolę mechanizmów uczenia się w percepcji złożonych bodźców:

„Możliwe,  że  cała  ta  złożona  aktywność  sprowadza  się  do  zaledwie  kilku  podstawowych  mechanizmów  uczenia  się.  Ostateczne  wyjaśnienie  będzie  prawdopodobnie  zawierało  dane  o  podstawowych  układach  połączeń  powstających  w  czasie  normalnego  rozwoju,  wraz  z  głównymi  algorytmami  uczenia  się,  które  zmieniają  owe połączenia  i  inne  parametry  neuronów.  Korę  mózgową  może  więc  w  istocie  cechować  prostota,   polegająca  nie  tyle  na  działaniu  dojrzałego  mózgu,  ile  na  sposobie,  w  jaki  dochodzi  on  do  tego  złożonego  działania,  wykorzystując  swą  wrodzoną  strukturę  i  bogate  doświadczenie  zdobyte  w  kontaktach  ze  światem  zewnętrznym.”  F.Crick  tłum.  B.Chacińska-Abrahamowicz,  M. Abrachamowicz.

We wcześniejszych próbach wyjaśnienia istoty świadomości podkreślano znaczenie uwagi, która wydobywa z pamięci aspekty postrzegania podlegające szczególnie intensywnej analizie i przetwarzaniu (R.Jackendoff: Consciousness and the Computational Mind. Bradford Books, MIT Press. Cambridge, MA 1987). W stanowisku takim, aczkolwiek nie prowadzącym do założonego skutku, można doszukać się podobieństwa do wyszukiwania w zasobach mózgowej pamięci informacji zaspokajających zainteresowanie (ciekawość) podmiotu uzyskującego w ten sposób świadomość. Jednakże istnieje zasadnicza różnica pomiędzy przypadkowym „przemiataniem” przy pomocy koncentracji uwagi zasobów pamięciowych w celu przekształcenia postrzeżonych wrażeń w kategorie zdefiniowane uprzednio lub dołączone do „drzewa znaczeń” rozwijającego się w wyniku kolekcjonowania i kategoryzacji nowych wrażeń a ciekawością, jako motorem sprawczym świadomości. Różnica ta polega na intencjonalnym działaniu umysłu poszukującego nowych spostrzeżeń zmysłowych lub bodźców wewnętrznych, związanych z penetracją struktur pamięciowych, w celu powiększania zasobów informacji dla dokonywanych później procesów przetwarzania i dalszej kategoryzacji, co jak przedstawiono wyżej, odpowiada funkcjonowaniu ciekawości.

Oczywiście model uwzględniający jedynie posługiwanie się kategoryzacją i językiem w celu zaspokojenia ciekawości nie tłumaczy wszystkich aspektów ludzkiej inteligencji. Objaśnia jedynie aspekt myślenia odróżniający nas od maszyn algorytmicznych. Jednakże ostatecznie usuwa zmorę testu Turinga w rozpoznaniu prawdziwie inteligentnego umysłu. Zbadanie czy badany przez nas umysł może być „zaciekawiony” daje możliwość usunięcia podejrzeń, że działa on na zasadzie „chińskiego pokoju” opisanego obrazowo przez Searle’a. Model ten rzuca także nowe światło na inteligencję zwierząt. Bezspornie wykazują one ciekawość. Brak im zwykle dostatecznie złożonego języka dla uogólnienia doświadczeń i spostrzeżeń oraz wyabstrahowania nowych kategorii. Toteż stopień ich inteligencji można skorelować ze stopniem rozwoju ich języka komunikacji wzajemnej, a nawet międzygatunkowej. Z drugiej strony, tworzone przez nas maszyny dysponują czasami złożonym językiem komunikacji dostosowanym do komunikacji z człowiekiem. Brak im jednak elementarnych cech ciekawości, co wyklucza traktowanie ich jako mózgi inteligentne.

W modelu tym, sztucznie uproszczonym w celu podkreślenia znaczenia niedocenianej dotychczas funkcji mózgu jaką jest ciekawość, poślednią rolę odgrywa pamięć. Długo właśnie ograniczenia pamięci traktowane były jako główna przeszkoda w modelowaniu SAI – silnej sztucznej inteligencji. Podkreślano przepaść pomiędzy możliwościami ludzkiego mózgu i liczbą komórek pamięciowych budowanych przez nas maszyn. Lecz obecnie tworzenie systemów o porównywalnych możliwościach pamięciowych stało się możliwe. Światowa sieć web łączy komputery, których zsumowane możliwości pamięciowe pozwalają marzyć o uzyskaniu świadomości. Jednakże równocześnie rozwój naszej wiedzy o funkcjonowaniu świadomości wykluczył taką możliwość w zamkniętych systemach zdeterminowanych przez zewnętrzne oprogramowanie. Tym niemniej pamięć odgrywa istotną rolę w procesach świadomościowych. Potężne zasoby pamięci są niezbędne dla dysponowania dostatecznie złożonym językiem. Podmiot inteligentny musi równocześnie dysponować pewną „wiedzą” „ekspercką” o „świecie”, w którym się znajduje realnie lub wirtualnie. Zakres tej wiedzy i złożoności języka decyduje o stopniu inteligencji. Warto tu zaznaczyć, że zaistnienie świadomości nie wymaga werbalizacji wrażeń. Język wewnętrznej komunikacji może być wysoce symboliczny. Wystarczy by system rozróżniał obiekty według dowolny kryteriów stosowanych do ich symbolicznych reprezentacji. Oczywiście reprezentacje te mają swe materialne odzwierciedlenie w strukturach przetwarzających informację w postaci śladów pamięciowych chemicznych, stanów pobudzeń elektrycznych lub zmian w strukturze (zależnie od budowy systemu).

Pojemność pamięci musi być dostateczna do tego, aby system „mózgowy” istoty inteligentnej nie odczuwał ograniczeń tworząc nowe skojarzenia na wyższych poziomach kategoryzowanych abstrakcji. A więc system pamięciowy powinien być otwarty lub sprawiać wrażenie otwartości. Mózgi zwierzęce, dysponujące komórkami nerwowymi, rozwiązują ten problem, umieszczając nowe informacje w nowotworzonych komórkach zwanych astrocytami lub zwiększając stopień złożoności struktur nerwowych, poprzez tworzenie nowych połączeń i powiązań sieci neuronowej, lub połączeń synaptycznych. Ponadto, rozważając znaczenie zasobów pamięciowych, pamięć pozwala na zachowanie ciągłości czasowej świadomości a szczególnie samoświadomości.

Samoświadomość wymaga stworzenia wytłumaczenia własnej obecności w postrzeganym świecie. Brak logicznego uzasadnienia własnego istnienia utrudni zbudowanie modelu świata, a więc istota tego świata ciekawa, na pewno takie uzasadnienie zbuduje. Jeśli tylko dysponować będzie pamięcią zdolną pomieścić historię bytu. Jest to nadzwyczaj istotne w przypadku występowania przerw w świadomości. Przecież budząc się rano ze snu jesteśmy świadomi swego obudzenia i porannych wrażeń. Jednakże pełna samoświadomość wymaga choćby potencjalnej możliwości odwołania się do pamięci o historii swojego istnienia. Jak się nazywamy? Skąd się tu wzięliśmy? Jakże dobrze jest pamiętać to wszystko, czego pozbawione są osoby cierpiące na amnezję. Jest to warunek minimalny odczuwania sensu życia. Kolejny warunek na drodze poszukiwania tego sensu to odczuwanie ciekawości. Wiele osób, szczególnie w podeszłym wieku, gdy wypalają się już wielkie namiętności, stwierdza, że żyje tylko z ciekawości. I biada im jeśli ta ciekawość wygasa. Brak aktywności skutkuje wstrzymaniem podziałów i odtwarzania komórek nerwowych, co daje fizjologiczne podłoże do osłabienia zdolności intelektualnych. Oznacza to zwykle wejście w fazę demencji, którą interpretować można jako obniżenie inteligencji.

Mimo tych wielorakich funkcji pamięci, ważnych dla świadomości, nazwałem jej rolę poślednią, ponieważ nie istnieje bariera minimalna pamięci, która wykluczałaby inteligentne zachowania. Prawdopodobnie zbyt mała pamięć ogranicza stopień inteligencji, jakkolwiek byśmy go nie definiowali. Jednakże nie eliminuje inteligencji w najbardziej ogólnym sensie.

Przyszłość inteligencji pod wpływem ciekawości

Czy inne właściwości umysłu istot żywych nie są równie istotne dla osiągnięcia świadomości? Emocje, odczuwanie bólu lub przyjemności, lub takie cechy jak pracowitość, wytrwałość, spostrzegawczość i dokładność, bezinteresowność, mściwość czyli agresja, instynkt samozachowawczy i inne podobne cechy „charakterów” żyjących organizmów. A ponadto ukoronowanie wszelkich uogólnień: mądrość i moralność. Można także rozważać znaczenie wewnętrznej motywacji do aktywności. Czy jakikolwiek system, pozbawiony motywacji, może wykazywać zainteresowanie czymkolwiek? Jak taka motywacja może powstać w toku ewolucji lub jak ją wszczepić martwemu systemowi przetwarzania danych od którego oczekujemy inteligentnego działania z wewnętrznej przyczyny. Motywację tę można stworzyć przez wyznaczenie celu istnienia, wskazanie sensu „życia”. Takie zewnętrzne narzucenie motywacji byłoby zgodne z kreacjonistyczną hipotezą powstania życia, ale jak to interpretować w przypadku inteligentnych robotów? Czy powinniśmy się im zaprezentować jako Stwórca – Wielki Konstruktor? Czy byłyby one wówczas zupełnie wolne? Utrzymanie ich w tym przeświadczeniu mogło by się nie powieść w dłuższym horyzoncie czasowym.

Oczywiście wszystkie te cechy są wytworem ewolucji i mają także znaczenie ewolucyjne, szczególnie w przypadku istot społecznych. Dla nich wszystkich znaleziono wytłumaczenie ukształtowania w procesach ewolucyjnych, w modelach konkurencji gatunków w warunkach ograniczonych zasobów i doborem krewniaczym lub grupowym. Wyjątkiem jest tzw. “mądrość”. Jest ona systemowo słabo definiowalna. Jest to pojęcie na tyle ogólne, iż trudno mu przypisać jednolite, mierzalne cechy. Na „mądrość” składa się wiele cech. Osobiście uważam, iż jest ona pochodną wiedzy i ciekawości.

Wszystkie wymienione tutaj cechy nie mają jednak związku z powstaniem świadomości. Oczywiście, moralność też jest wytworem umysłu a więc i ewolucji. Ale my poszukujemy właściwości podstawowych dla stworzenia SAI. To właśnie ciekawość jest immanentną cechą prawie wszelkiego życia. Eksplorowanie środowiska jest jego podstawowym przejawem. Uczynienie maszyn moralnymi zostawmy sobie na deser.

Oddzielnym problemem jest rozpoznanie obcej inteligencji. Ze względu na subiektywny charakter zjawisk mentalnych, dotychczasowe kryteria w zupełności zawodzą. Rozpoznanie inteligencji naturalnej, to znaczy wykształconej ewolucyjnie, jest trudne ze względu na bariery językowe. Rozpoznanie inteligencji sztucznej, nawet dysponującej znanym nam językiem, może być jeszcze trudniejsze. Maszyna może zwyczajnie nie przejść testu Turinga. Może ona wcale nie odpowiadać na sformułowane przez nas pytania. Jej odpowiedzi, mimo posługiwania się tym samym językiem, mogą być dla nas niezrozumiałe, jeśli dojdzie ona do nowych wniosków, wprowadzi nowe kategorie, rozwinie język o nowe nazwy i znaczenia. Ponadto komunikacja z inteligentną maszyną może ulec komplikacji, gdy to ona zacznie zdawać pytania. To nas może poddać testowi zaciekawiona maszyna. To my możemy nie przejść testu Turinga, któremu podda nas komputerowy interlokutor. Należy mieć nadzieję, iż nieznana nam forma inteligencji ujawni zachowania społeczne charakterystyczne dla istot inteligentnych a także ciekawość pozwalającą nam bezspornie ją zidentyfikować. Jak może to być trudne wskazują trudności w nawiązaniu kontaktów z osobami z zaburzeniami psychicznymi lub z inteligentnymi zwierzętami.

Wyposażenie maszyn logicznych, komputerów i mózgów przyszłych robotów w funkcję symulującą ciekawość istot żywych jest zatem najpilniejszym zadaniem na drodze do stworzenia sztucznej inteligencji SAI. Byłoby to tym pilniejsze, gdyby, jak wieszczą niektórzy biolodzy, ewolucja ludzkiego umysłu została zahamowana poprzez wyłączenie człowieka z typowych mechanizmów ewolucyjnych. Jest niezaprzeczalnym faktem, że ludzkość nie podlega dotychczasowym mechanizmom selekcyjnym wynikającym z darwinowskiej walki o byt.

Na szczęście postęp wiedzy odkrywa przed człowiekiem struktury czasoprzestrzeni tak złożone, że ich poznanie stanowi nowe wyzwanie dla możliwości ludzkiego umysłu. Odwieczna ciekawość popycha człowieka do badania i prób zrozumienia osobliwości form energii, które przejawiają się w skali kwantowego mikroświata i makrokosmosu w którym żyjemy. Podejrzewać należy, że dalszy postęp wiedzy uzależniony będzie od dalszego rozwoju struktur mózgu zdolnych do modelowania odkrywanych zjawisk, nieskończenie odległych od pojęć wykształconych w toku naszego dotychczasowego rozwoju ewolucyjnego. Obecnie jedynie społeczności naukowców wyćwiczonych w abstrakcyjnym myśleniu i wyposażonych w wyrafinowane zdolności intelektualne zdolna jest do pojmowania całej złożoności współczesnej świata. Może to wskazywać, że jesteśmy na granicy zdolności pojmowania złożoności zjawisk, które przejawia wszechświat w którym żyjemy. Być może dalszy postęp w jego zrozumieniu uzależniony będzie od wprzęgnięcia w jego służbę Sztucznej Inteligencji.

Ścigać się ona będzie z rozwojem możliwości intelektualnych człowieka na drodze zmian ewolucyjnych, które przez dalszy wzrost złożoności mózgu, np. poprzez wzrost koncentracji astrocytów może doprowadzić do przekroczenia dotychczasowych ograniczeń biologicznych. Czy dalsza specjacja pod presją ludzkiej ciekawości doprowadzi do wyodrębnienia nowego gatunku, jak to się już działo pod wpływem ciekawości zwierzęcej? Być może. Lecz jeżeli nie, to przekroczenie tych ograniczeń pozostawimy obcej inteligencji. Z dużym prawdopodobieństwem sztucznej.

Natomiast ciekawym zagadnieniem jest, czy nawet prosty system zdolny do formułowania pytania „Co to jest?” i wyposażony w sztuczny język może wykazywać pseudo ludzką inteligencję. Jeśli pozbawić to pojęcie takich ludzkich aspektów jak wpływ emocji, instynkt samozachowawczy, kontekst społeczny itp., to wydaje się, że tak! Wystarczy odrobina pamięci i zdolność dokonywania porównań, znajdowania analogii i tworzenia nowych uogólnień poprzez tworzenie nowych kategorii czyli zdolność do rozwoju własnego języka. Niewątpliwym efektem, poniekąd ubocznym, takiego tworu będzie samoświadomość, ponieważ pytanie „Co to jest?” sformułowane zostanie nieuchronnie także wobec śladów własnej obecności. Zakładany stopień funkcjonalnej inteligencji czyli zdolność wnioskowania właściwa dla maszyn o wymaganym stopniu złożoności z łatwością pozwoli znaleźć jedyną poprawną odpowiedź na to pytanie: „To Ja”.

Należy zatem uznać, że umiejętność zaspokojenia własnej ciekawości, a co za tym idzie posiadanie samoświadomości jest nie tylko warunkiem koniecznym ale i wystarczającym bycia inteligentnym w szerokim sensie tego pojęcia.

Warszawa, 15.01.2010

Follow

Otrzymuj każdy nowy wpis na swoją skrzynkę e-mail.