Monografias | Individuación e información Parte-Todo Representación para el procesamiento computacional del lenguaje

Individuación e información Parte-Todo Representación para el procesamiento computacional del lenguaje

Resumen: En la comprensión del lenguaje juegan un papel determinante las relaciones tácitas que se establecen entre los distintos significados denotados por las unidades lingüísticas.

Publicación enviada por Salvador Climent Roca


 

ÍNDICE 

Prefacio 

0. Introducción 

1. Marco general y cuestiones generales 

2. Aproximaciones al conocimiento parte-todo 
2.1 Enfoques léxico-relacionales: la meronimia 
2.2 Aproximaciones constructivistas 
2.3 Conclusiones 

3. Modelos computacionales 
3.1 WordNet 
3.2 EuroWordNet 
3.3 Representación del conocimiento léxico mediante estructuras de rasgos tipificadas: LRL-LKB 
3.4 Recapitulación 

4. Análisis del problema 
4.1 Lexicalización, individuación y categorización 
4.2 Propuesta de definición de los tipos de relación parte-todo 
4.3 Recapitulación 

5. Individuación mediante construcciones partitivas 
5.1 Nombres partitivos: aproximación funcionalista y similitud con clasificadores 
5.2 Propiedades generales de los nombres y grupos partitivos 
5.3 Conclusiones 

6. Representación formal del significado de los partitivos 
6.1 Marco teórico: el Lexicón Generativo 
6.2 Formalización de la semántica de los partitivos en el marco del Lexicón Generativo 
6.3 Conclusiones 

7. Polimorfismo léxico: alternancias de referencia y restricciones selectivas de los partitivos 
7.1 Polimorfismo léxico 
7.2 Clasificación de los nombres partitivos en función de sus restricciones selectivas 
7.3 Consideraciones finales 

8. Conclusiones generales 

9. Líneas de trabajo futuras 

Referencias 

Apéndice: extracción de relaciones meronímicas

 

El mundo era tan reciente, que muchas cosas carecían de nombre,
y para mencionarlas había que señalarlas con el dedo.

GABRIELGARCÍA MÁRQUEZ:
Cien años de soledad. 1975. Plaza y Janés. Barcelona.



   En la comprensión del lenguaje juegan un papel determinante las relaciones tácitas que se establecen entre los distintos significados denotados por las unidades lingüísticas. Tomemos por ejemplo el primer párrafo de 'El largo adiós', de Raymond Chandler:

   La primera vez que posé mis ojos en Terry Lennox, éste estaba borracho en un Rolls Royce Silver Wraith, frente a la terraza de The Dancers.

   Simplemente a partir de ese primer párrafo, el lector puede hacerse la siguiente composición de lugar: un tal Terry Lennox se hallaba en el interior de un coche, el cual se hallaba situado frente a un bar o restaurante. Las inferencias son posibles debido a que el lector tiene conocimiento de que (1) un Rolls Royce es un coche; y (2) una terraza es -en el sentido que resulta apropiado en el texto- la parte exterior, de cierto tipo de locales públicos.

    La inferencia (1) es debida, a grandes rasgos, a la relación semántica comúnmente conocida como relación Es-Un (o de Hiperonimia/Hiponimia); en este caso concreto, a una variante específica, la relación Instancia-De. Dicha relación ha sido ampliamente estudiada y cualquier tipo de lexicón para el tratamiento del lenguaje está organizado en mayor o menor medida basándose en la misma.

    La inferencia (2) es debida a la relación conocida como parte-todo (o de Meronimia/Holonimia). De este segundo tipo de relación semántica es del que trataremos aquí.

    Otro aspecto del fenómeno puede ser ilustrado a la vista del inicio del capítulo 14 de la misma novela:

   A la mañana siguiente me estaba limpiando el talco del lóbulo de la oreja cuando sonó el timbre. Fui a abrir la puerta y me topé con un par de ojos azul violeta.

En este caso la interpretación es que Marlowe, presumiblemente, ha abierto la puerta a una persona. Dicha interpretación es posible, en gran parte, a causa de una metonimia: los ojos son una parte del cuerpo; concretamente una parte del cuerpo que tiene una palabra específica para denotarla, 'ojo'. Pero no todas las partes de cosas pueden ser denotadas mediante una sola palabra. El 'lóbulo de la oreja', por ejemplo, es tan parte del cuerpo, como pueda serlo un 'ojo', y, al menos en castellano, se describe no mediante una sola palabra sino mediante una paráfrasis: un grupo nominal del que sobresalen un nombre que hace relación al todo, 'oreja'; y otro que hace ciertas precisiones sobre la parte en cuestión, 'lóbulo' -"cada una de las partes, a manera de ondas, que hacen saliente en el borde de una cosa; como en la hoja de una planta" (Casares, 1959)-.

    A este tipo de relación parte-todo, no léxica sino compositiva, le dedicaremos aquí una atención especial.

0. Introducción


    En este trabajo me he propuesto tratar de la codificación en el lenguaje del conocimiento parte-todo y de su representación computacional. Me ceñiré a la semántica léxica nominal del español, e intentaré dar, en dicho ámbito, con un tratamiento global e unificado del fenómeno.

    Se trata de un tema aparentemente heterogéneo, dado que abarca aspectos tales como la meronimia (o relaciones parte-todo entre lexemas), la pluralización (o expresión morfológica de una relación de elemento a multiplicidad), la polisemia lógica (como en la alternacia léxica entre la denotación de una entidad y la de la sustancia que la conforma), o los sintagmas partitivos (o expresión no léxica de relaciones parte-todo). Mi hipótesis es que todo ese abanico de fenómenos lingüísticos corresponde a un único y reducido conjunto de esquemas cognitivos, y puede ser explicado y representado en base a los mismos.

    En lo que resta de capítulo plantearé mi aproximación genérica al tema, para concluir con la presentación del esquema del trabajo.
 

    Planteamiento

    La capacidad de referirse a entidades como unidades discretas y diferenciables es un mecanismo del que, muy probablemente, cualquier lenguaje existente o concebible deba disponer. Algunos autores, como Lyons (1977), han denominado a dicho mecanismo, mediante el cual las lenguas entresacan entidades individuales de un continuum de referencia, individuación. De forma genérica, entenderemos por individuación la capacidad que tienen los hablantes para referirse a una determinada entidad o suceso de forma distinta y separada de un todo más inclusivo del que se concibe que forma parte.

    Con las debidas matizaciones, puede convenirse que el objeto de la comunicación humana, el mundo que nos rodea o cualquier otro mundo posible o imaginable, está conformado por una amalgama más o menos continua de entidades y sucesos que es preciso desbrozar para que la propia comunicación sea posible. Centrándonos en el caso de la individuación de entidades, se observa que las lenguas utilizan múltiples recursos para llevarla a cabo. En español, por ejemplo, puede usarse la referencia deíctica ('aquéllo') u otros pronombres ('él'), así como una gran variedad de sintagmas nominales ('dos árboles', 'una rama', 'muchas copas de vino', 'ese equipo', 'un montón de gente', 'una cabeza de ganado'). Otras lenguas utilizan recursos ligeramente diferentes; por ejemplo las lenguas con clasificadores (japonés, chino mandarín, thai) construyen la referencia individualizada mediante grupos nominales en los que el nombre o su especificador combinan con un morfema o lexema, denominado clasificador, el cual tiene una doble función: la de indicar que la entidad denotada es una entidad discreta y contable, y la de clasificarla de acuerdo con ciertas especificaciones semánticas y perceptuales, tales como tipo, forma, animacidad, consistencia, tamaño o disposición. Dichos clasificadores, utilizados en ausencia del nombre, tienen, como los pronombres en español, capacidad de referencia anafórica.

    De acuerdo con la corriente teórica habitualmente denominada gramática cognitiva, en el origen de la mencionada capacidad de individuación, se halla la capacidad de categorización. Desde dicho punto de vista (p.e. vid Lakoff, 1987; Rosch, 1976), determinados elementos del continuo son percibidos por los hablantes como propietarios de rasgos recurrentes, por lo que son considerados como pertenecientes a una categoría conceptual. Por ejemplo, observado que la gran mayoría de las cosas a las que en castellano se denominan 'árbol' presentan en su parte superior un número indeterminado de apéndices en los que se situan las hojas y los frutos, es posible convenir que, pese a la gran diversidad de aspectos que ofrecen y a que físicamente forman una única unidad continua con el árbol, tales apéndices pueden reputarse como pertenecientes a una categoría de cosas, que en castellano recibe el nombre de 'rama'.

    La expresión lingüística de las categorías conceptuales está directamente relacionada con el fenómeno de la convencionalización, y por consiguiente con múltiples factores dependientes en último término de cada lengua en particular: cada lengua designa a los diversos rangos de entidades y sucesos de acuerdo con los mecanismos de que dispone. El grado máximo de convencionalización es la lexicalización, o expresión de un determinado concepto en una lengua mediante un determinado lexema. Grados menores de convencionalización resultan en la expresión de un concepto mediante construcciones expuestas a diversos grados de variabilidad, desde expresiones complejas prácticamente invariables, como las lexías, hasta estructuras sintagmáticas sujetas a un mayor o menor espectro de realizaciones alternativas, tanto en lo relativo a su estructura como a los elementos léxicos que en ella pueden insertarse.

    Sea de forma lexicalizada o sintagmática, diversos tipos de entidades pueden ser referidos de forma discreta e individualizada: individuos ('un árbol', 'un palo'); conjuntos o pluralidades de individuos ('una manada de elefantes', 'un comité', 'gente', 'personas'); cantidades de masas o substancias ('un vino', 'un vaso de vino', 'una madera', 'una barra de madera'); o partes, porciones o elementos de entidades individualizadas ('una rama', 'la cima de una montaña', 'una cabeza de ganado', 'uno del equipo').

    De modo íntimamente relacionado con la anterior apreciación, se constata que pueden definirse diversos tipos de relaciones de inclusión entre entidades (o, desde otro punto de vista, entre expresiones que las designan), como por ejemplo las existentes entre 'árbol' y 'rama', 'manada de elefantes' y 'elefante', 'barra de madera' y 'madera', o 'animal doméstico' y 'ganado'. Se trata éste de un tipo de conocimiento del que disponen los hablantes y que es profusamente utilizado en la construcción del significado del discurso lingüístico; por ejemplo, en una emisión lingüística en la que se manejen conceptos o palabras tales como 'ramas', 'copa', 'fruto', 'hojas', 'raíces', 'savia' o 'bosque', un hablante del español podrá deducir que, aunque no se cite de forma explícita, se está hablando de árboles.

    Tal tipo de información semántica, la información parte-todo, ha sido estudiada en profundidad desde el punto de vista lexicalista por autores como Cruse (1986) o Winston et al. (1987), los cuáles han postulado diversos tipos de relaciones entre todos y partes, o relaciones meronímicas, entendidas como uno de los medios de estructuración interna del lexicón. Dichas aproximaciones, por ser esencialmente léxico-semánticas, no abordan de manera directa el hecho de que las relaciones parte-todo no únicamente se realizan en el lenguaje en forma de relaciones tácitas entre lexemas, sino que también, como he sugerido antes, pueden ser expresadas a partir de unidades lingüísticas más complejas. Por ejemplo, un caso de individuación que da lugar a una relación meronímica nominal, como es el de 'meandro' respecto a 'río', es perfectamente análogo al que establece el sintagma 'brazo de río' en relación al mismo tipo de entidad global: en ambos casos se designa a una parte del río concebida como una entidad individual y diferenciada.

    Este tipo de grupos nominales partitivos, como 'brazo de río', -compuestos de un nombre en función partitiva, la preposición 'de' y un nombre en posición de complemento que designa la entidad global de referencia-, constituyen uno de los modos fundamentales de denotación de categorías conceptuales no lexicalizadas en español, y realizan funciones semánticas análogas en muchos aspectos a las que realizan los nombres comunes, como por ejemplo la de establecer relaciónes parte-todo entre entidades; pero no únicamente éstas, sino que, del mismo modo que los clasificadores en otras lenguas, también aportan información de otros tipos (forma, magnitud, etc.).

    El análisis de las construcciones partitivas en español y de sus clases nos llevará a examinar qué tipos de nombre pueden ocupar en diferentes casos cada una de las posiciones del sintagma. La observación de la posición del complemento y el objetivo de definir sus características semánticas conducirá a su vez al planteamiento un problema de polisemia nominal que denominaré polimorfismo referencial.

    Tómense en consideración dos sintagmas partitivos como 'un montón de café' y 'un montón de cafés', en los que en ambos casos se formula una cuantificación respecto a un todo de referencia -café- pero con diferentes matices de significado. El primer sintagma es monosémico: en él se cuantifica en relación a la sustancia denominada 'café'. El segundo sintagma, en cambio, es ambiguo, y, además, en él el todo de referencia es semánticamente distinto del del primero: 'un montón de cafés' podrá referirse, bien a tazas -o dosis convencionales- de café (como en 'para mantenerme despierto tomé un montón de cafés'), bien a clases -o subtipificaciones de la clase genérica- de dicha sustancia (como en 'en el nuevo supermercado puedes elegir entre un montón de cafés'). La situación que sugieren los anteriores ejemplos es la siguiente: un mismo lexema es susceptible de denotar conceptos que son distintos, pero que sin embargo se hallan estrechamente relacionados tanto entre sí como con lo que pudiera considerarse un significado común básico subyacente a todos ellos.

    Éste y otros tipos similares de lo que podría calificarse como fenómenos de polisemia débil -denominados polisemia lógica por diferentes autores, como Pustejovsky (1995)- constituyen un fenómeno del que es preciso dar cuenta en el lexicón por las múltiples implicaciones semánticas que plantea, entre las que se cuenta la caracterización de los referentes de las construcciones partitivas, pero también otros aspectos del fenómeno parte-todo como la alternancia sustancia-entidad ('cordero' como animal vs. 'cordero' como plato o alimento) o la pluralización (expresión de una relación de elemento a multiplicidad).

    A lo largo de este trabajo analizaré los aspectos de la semántica nominal hasta aquí planteados con el objetivo de proponer una representación formal de los mismos en un lexicón computacional para el tratamiento del castellano. De forma más específica, trataré en primer lugar del conocimiento meronímico, y a continuación de la individuación mediante sintagmas partitivos y del fenómeno relacionado del polimorfismo referencial, aspecto este último para el cual me basaré en el trabajo desarrollado por Jackendoff (1991) sobre formalización del sustrato conceptual que desde su punto de vista subyace al conocimiento léxico.
 

    Esquema del trabajo

    Tras un primer capítulo destinado a cuestiones preliminares (Cap. 1) presentaré las distintas aproximaciones al fenómeno parte-todo (Cap. 2) y los modelos computacionales de representación del conocimiento que son relevantes para el presente trabajo (Cap. 3). En el siguiente capítulo (Cap. 4) formularé mi propio análisis, para pasar a continuación a examinar con más detalle el problema de las relaciones parte-todo expresadas mediante construcciones partitivas (Cap. 5). En Cap. 6 describiré el marco de representación del conocimiento léxico, basado en Pustejovsky (1995), dentro del cual desarrollaré (en Cap. 6.2) la formalización de diversos modos de individuación sintagmática del conocimiento parte-todo, mostrando sus implicaciones para el tratamiento de la semántica compositiva de la oración. Para un adecuado tratamiento de los sintagmas partitivos y también de otros aspectos del fenómeno, como la pluralización o la alternancia léxica sustancia-entidad, presentaré en Cap. 7 un modelo de representación del polimorfismo referencial. Para finalizar expondré las conclusiones del trabajo y las líneas futuras de investigación.

1. Marco general y cuestiones preliminares


    La lingüística computacional trata de la formalización o codificación del lenguaje natural en un lenguaje formal, tratable por medios informáticos con fines aplicados diversos, tales como traducción automática, acceso a bases de datos, extracción de información de textos o comunicación con sistemas informáticos -es decir, con lenguajes formales- mediante el lenguaje natural. En la última década, gran parte de la investigación en lingüística computacional se ha centrado en la semántica léxica, a partir de la constatación de que una parte muy considerable de la información lingüística reside, o puede ser explicada, a partir de la información contenida en las entradas léxicas.

    Coexisten en este momento diversos tipos de aproximación a la lexicografía computacional, cada uno de ellos con diversos grados de compromiso con respecto a formulaciones teóricas del campo de la lingüística, la psicolingüística, la filosofía del lenguaje o la ciencia cognitiva. Aunque en último término la lingüística computacional, no depende de forma inexcusable del seguimiento de una u otra teoría lingüística o cognitiva, resulta obvio señalar que, con carácter previo a la formulación de cualquier tipo de representación computacional del lenguaje, es preciso haber tomado antes cierto tipo de decisiones previas acerca de cómo se va a abordar el lenguaje natural y qué aspectos del mismo se considera preciso representar.

    Para los propósitos finales de este trabajo -la formulación de representaciones lingüísticas tratables computacionalmente- entenderemos en principio la lingüística, en un sentido ciertamente amplio, como la descripción de una lengua; y de forma más específica, como la construcción un modelo de las regularidades que, a juicio del lingüista, se manifiestan en el uso de una lengua. Ello implica asumir la idealización estructuralista del lenguaje como sistema ontológicamente exterior a los hablantes (aunque por supuesto conocido, compartido y usado por ellos con objetivos semióticos varios). Asimismo, el objeto de la descripción, 'la lengua', se entenderá como 'una lengua' en particular, en este caso el castellano. Cabe resaltar que ambas asunciones son de tipo metodológico; por consiguiente no entraré aquí en disquisiciones sobre la entidad real del lenguaje bien como sistema, bien como capacidad mental (competencia), o sobre las presuntas cualidades de universalidad o innatismo que puedan atribuírsele.

    Sin embargo, estas consideraciones no deben ser entendidas como un modo de desentenderse de la teoría. Por el contrario, los modelos de representación del conocimiento son en gran medida deudores de modelos o ideas provinentes de los campos de la psicolingüística y la ciencia cognitiva; existiendo un notable consenso en la comunidad investigadora respecto a que los modelos computacionales del lenguaje deben ser, en la medida de lo posible, un reflejo de los modelos mentales. Siendo el lenguaje una facultad cognitiva humana, es de esperar que un modelo formal del lenguaje resultará tanto más acertado en cuanto mejor modelo sea de dichas facultades cognitivas. Éste es también mi convencimiento. Como podrá comprobarse en lo sucesivo, las representaciones computacionales que formularé a lo largo de este trabajo estarán basadas en ideas provinentes de la psicolingüística y la ciencia cognitiva; en especial en el modelo relacional de la memoria léxica, en la gramática cognitiva, y en las hipótesis semántico-conceptuales de Jackendoff.

    Por otra parte, formular algún tipo de análisis o representación del léxico de una lengua, implica, por una parte, utilizar una terminología metalingüística para manejarse en dicho terreno; y por otra, pretender que de algún modo se está representando o aludiendo a algo de tan difícil definición como es 'el significado' de las palabras. Como es sabido, la elucidación de qué es o qué puede entenderse exactamente por significado así como, de forma inseparable, la definición de términos tales como 'significado', 'sentido', 'referencia', 'denotación', 'designación', etc., es una materia que ha ocupado y sigue ocupando a filósofos y lingüistas como mínimo desde la Grecia clásica. No puedo pretender terciar en tan arduo debate, sino tan sólo situarme mínimamente en dicho marco a fin de utilizar una terminología metalingüística lo menos gratuita posible. Para ello describiré en primer lugar de modo necesaria y deliberadamente esquemático los modelos fundamentales o tendencias mayoritarias a partir de las cuales se han desarrollado la mayor parte de formalismos de representación del significado.

    Básicamente, existen dos tipos de aproximación a lo que pueda significar el 'significado' de una expresión de un lenguaje: una (habitualmente denominada 'realista') que parte de Aristóteles, y otra (a la que podríamos llamar 'abstraccionista') que emerge de la obra de Platón.

    Ambas aproximaciones comparten la muy sensata asunción de que existe la realidad, es decir, el mundo nuestro de cada día, con sus gatos, sus alfombras, sus árboles, sus sillas y sus taburetes; y también la constatación de que la organización de dicho mundo en entidades individualmente designables no es en absoluto un asunto trivial (son famosas en semántica lingüística las discusiones sobre qué es una silla y qué un taburete; tampoco es fácil decir si una mecedora o una silla eléctrica deben ser contadas como sillas; o si cada árbol viene determinado por la existencia de un tronco, o quizá por la existencia de un conjunto común de raíces, bajo tierra o a una distancia prudencial -¿cuál?- sobre el nivel del suelo). Sin embargo, una y otra difieren en que mantienen posturas radicalmente diferentes sobre si un lenguaje (el lenguaje natural o cualquier otro) puede o no (y si puede, cómo) describir el mundo, o 'referirse' a él.

    La aproximación realista mantiene que las unidades del lenguaje refieren directamente a entidades del mundo (ver fig. I.1). Los desarrollos basados en la misma utilizan para tal propósito la herramienta formal denominada 'conjuntos': dado un universo (que por otra parte puede ser el mundo físico, un mundo abstracto, o cualquier mezcla de ambos), las entidades en él vienen de un modo u otro individualizadas, y estas individualidades se agrupan de forma natural en clases, definibles mediante condiciones necesarias y suficientes, y por tanto formalizables mediante conjuntos. En los modelos derivados de la aproximación realista no importa demasiado saber cómo se produce la individuación, de hecho puede producirse de infinitos modos: lo relevante es que cada modo de individuación corresponde a posibles conjuntos. Así, puede haber un conjunto que contenga todo tipo de sillas, sillas eléctricas incluídas, otro que no incluya sillas eléctricas pero sí tronos y mecedoras, y un tercero que incluya sillas, sofás, serpientes venenosas y personajes de "El Quijote".


Fig. I.1: La significación según el modelo realista

    Por contra, desde un punto de vista platónico o abstraccionista, se considera que un lenguaje no puede referir al mundo, sino únicamente a un universo consistente en abstracciones u objetos de orden matemático, cuya naturaleza ontológica es completamente disjunta de la de las colecciones de objetos del mundo real (ver fig. I.2).


Fig. I.2: La significación según el modelo abstraccionista

    Ambos modos de comprender la significación de un lenguaje son formalizables, y de hecho han sido formalizados, mediante una semántica teórica de modelos, es decir, un sistema consistente en (i) un lenguaje o formalismo que disponga, entre otros recursos, de nombres (propios) para individualidades y nombres (comunes) para conjuntos de ellas; (ii) un universo (o múltiples universos posibles) que conste de individualidades de referencia; y (iii), un conjunto de valores de verdad (Verdadero y Falso) que relaciona uno con otro.

    En todo caso, la diferencia fundamental entre las aproximaciones realista y abstraccionista es que en la segunda, al contrario de lo que sucede con la primera, el universo del discurso no puede en ningún caso entenderse como el mundo. Por tanto, dicha aproximación introduce la noción de un tercer nivel de representación semántica: un nivel abstracto distinto de los niveles del lenguaje y del mundo de referencia. Desde este punto de vista, que ha dado origen a la mayoría de los modelos semióticos y lingüístico-semánticos que hoy nos son familiares, el lenguaje (A) puede describir el mundo (C), pero debe hacerlo a través de la mediación del nivel abstracto intermedio (B). Por contra, desde el punto de vista realista, A y B son básicamente la misma cosa: los signos de A no son sino nombres para las categorías de B.

    Los principales herederos de la concepción platónica del significado son el modelo de Frege (1892) y el de Ogden y Richards (1923). En este último -en el que ya se entiende abiertamente 'lenguaje' como 'lenguaje natural'- los tres niveles son los denominados (A) Símbolo, (B) Pensamiento y (C) Referente (ver fig. I.3), los cuales, según Hayes (1994), deben ser entendidos como A:Lenguaje, B:Significado, C:Mundo. La noción subyacente, sin embargo, no es en absoluto novedosa, dado que puede ser hallada anteriormente (cf. Serrano, 1983) en los estoicos (que diferencian "aquello que es significado", "aquello que lo significa" y el "objeto"), en San Agustín (quien en 'De Dochtrina Cristiana' asimismo plantea una distinción entre signo, significado y cosa) y en los escolásticos medievales (cf. Ullmann, 1962), que acuñaron la máxima "vox significat mediantibus conceptibus" (la palabra significa mediante los conceptos).


Fig. I.3: El lenguaje según el modelo de Ogden y Richards (I)

    Este tipo de modelos suele ser representado gráficamente de modo más habitual mediante un triángulo como en la fig. I.4, en el que, dependiendo de cada aproximación en particular, cada nivel (especialmente el nivel abstracto, B) y cada relación entre niveles goza de distinta naturaleza ontológica, recibe distinto tipo de contenido y, en definitiva, es denominado de forma diferente. En todo caso, se asume que el nivel B es, aparte de un nivel abstracto, algún tipo de estructura o representación mental, llámesele 'pensamiento', 'idea', 'significado' o 'concepto'. En cuanto a las relaciones que ponen en correspondencia a los niveles de representación, Ogden y Richards las denominan de la siguiente forma: un símbolo 'simboliza' un pensamiento (r1); un pensamiento 'refiere' a un referente (r2); y un símbolo 'representa' a un referente (r3).


Fig. I.4: El lenguaje según el modelo de Ogden y Richards (II)

    El diagrama de la fig. I.4, sin embargo, no contempla la posibilidad de que, permaneciendo un referente inalterado, el significado de un nombre pueda cambiar para el hablante, sea por causa de alguna alteración en la percepción, en el conocimiento o en el sentimiento hacia el mismo.

    Frege (1892) sí había abordado el problema, estableciendo la distinción del contenido significativo entre 'referencia' -bedeutung- y 'sentido' -sinn-, según la cual dos signos (p.e. 'el lucero del alba' y 'la estrella de la noche') pueden tener un mismo referente (el planeta Venus), pero diferente 'sentido'; e incluso un signo (p.e. 'el cuerpo celeste más alejado de la tierra') puede tener sentido pero es dudoso que tenga referencia.

    En la terminología de Frege, un 'signo' expresa un 'sentido'; un 'sentido' designa una 'referencia'; y un 'signo' tiene una 'referencia' -ver fig. I.5-.

    Es preciso hacer notar dos aspectos que diferencian al modelo fregeano de los modelos mentalistas al estilo del de Ogden y Richards.


Fig. I.5: La significación según el modelo de Frege

    En primer lugar, adviértase que para Frege, el 'sentido' no es la representación que se pueda formar en la mente: la representación mental es un objeto individual y subjetivo, mientras que el 'sentido' fregeano es un ente objetivo, propiedad común de muchos y susceptible de ser transmitido de generación en generación. En consecuencia, no debe confundirse el nivel B de Odgen y Richards -de orden mental- con el nivel B de Frege, el 'sentido' -de orden estrictamente abstracto-.


Fig. I.6: Comparación de los modelos platónico y fregeano

    En segundo lugar, debe hacerse notar que para Frege, el nivel de los referentes no es el mundo real, sino el mundo de los conceptos (en los que, en su terminología, 'caen' los objetos o extensiones del mundo real, pero que no son objetos del mundo real). Por consiguiente, el triángulo signo-sentido-referente -o en su equivalente para expresiones: expresión-sentido-concepto- de la semántica de Frege, no es análogo al triángulo de Ogden y Richards (fig. I.4) ni al genérico de los modelos platónicos (fig. I.2), dado que en Frege el mundo real de nuestras cosas cotidianas no juega papel directo alguno (únicamente el papel indirecto de 'caer' en clases de referentes). Por contra, el nivel B (o 'sentido') de Frege debe ser interpretado como un nuevo nivel interpuesto entre los niveles A y B de los modelos filoplatónicos, correspondiendo el nivel C de Frege ('referentes'/'conceptos') al nivel B de estos últimos (ver fig. I.6).

    Finalmente, apuntemos que el modelo semántico fregeano también es representable, por supuesto y por antonomasia, mediante una semántica teórica de modelos.

    Otra manera de enfocar el asunto, la cual parece representar la primera gran alternativa a los modelos platónico y aristotélico, es la que emerge de los trabajos de Putnam (1981) en filosofía, Rosch (p.e., 1973) en psicología cognitiva, Langacker (1991) en lingüística, y otros en diversos campos, y se compendia y extiende en Lakoff (1987): la aproximación 'constructivista' o 'cognitivista'. El punto básico de dicha aproximación es la negación de la validez como teorías semánticas de los modelos basados en aparatos lógico-simbólicos (conjuntos, condiciones de verdad, etc.) en tanto en cuanto "el significado no puede ser caracterizado por la manera en que unos símbolos son asociados a cosas en el mundo" (Lakoff, op.cit.). El cognitivismo desplaza del centro del debate semántico a los formalismos y sitúa en su lugar al hombre y a sus capacidades (cognitivas) de comprensión o 'construcción' de la realidad externa.

    Una visión prejuzgadora del cognitivismo, como la propia de Hayes (1994), considerará la aproximación como confusa y en definitiva poco científica en tanto la entiende como poco menos que la asunción de una incapacidad para referirse al mundo real; y podrá emparentarla, peyorativamente, con la idea de Whorf (1956) de que el mundo exterior, sin el lenguaje, no es mas que un caos inefable. Una visión filosóficamente favorable, por contra, la emparentará con el más prestigiado Wittgenstein (p.e., 1953) en el sentido de que no debe abordarse el problema de la significación como un terreno en el que las palabras sean las protagonistas exclusivas en tanto que objetos autónomos contenedores de significado.

    El cognitivismo reclama la influencia de Wittgenstein en varios aspectos, y no rechaza de plano la de Whorf (y Sapir); pero lo que en ningún caso debe entenderse acerca de esta aproximación es que (como parece entender Hayes) niegue la existencia o la posibilidad de acceso a una realidad objetiva. El cognitivismo simplemente dice que no puede existir una descripción objetivamente correcta de la realidad, sino que existen múltiples maneras de describirla o comprenderla, y en todo caso éstas son fruto de una construcción (mental, y más o menos antropocéntrica) que hacen los hablantes de la propia experiencia.

    El modelo cognitivista puede ser representado esquemáticamente del mismo modo que el de Ogden y Richards (1923) (ver fig. I.4) ya que también en éste se postula la existencia de objetos mentales que median entre el lenguaje y el mundo externo. La diferencia fundamental radica en la naturaleza de los mismos. En primer lugar, para el cognitivismo dichas estructuras no son estrictamente lingüísticas sino que forman parte de los sistemas cognitivos generales y, de manera decisiva, no se consideran objetos con referencia en entidades del mundo real (u otros mundos posibles) sino modos de aprehenderlo y construirlo en la mente. Por otra parte, las clases mentales en que se organiza dicho conocimiento no pueden ser vistas como conjuntos de elementos sino como categorías difusas definibles a partir de prototipos (ejemplares centrales o idóneos) o esquemas estereotípicos.

    En otro orden de cosas, se considera que dicho sistema de representaciones mentales es, como en el caso del 'sentido' de Frege, algo compartido por los hablantes de un mismo sistema cultural (típicamente con reflejo en un mismo sistema lingüístico); y, como en los modelos de inspiración platónica, la relación de significación básica se establece entre el nivel lingüístico (A) y dicho nivel abstracto (B).

    El modelo cognitivista, por definición, no es representable, mediante una teoría semántica de modelos.

    Los modos básicos de entender la significación que hasta aquí hemos esbozado (el realista o aristotélico, el platónico-fregeano, y la alternativa constructivista a los dos anteriores) son filosóficamente irreconciliables. Sin embargo, ello no debe sumir en el desconcierto al lingüista computacional de modo que su trabajo quede bloqueado a la espera de la resolución de tales problemas filosóficos. La función del procesamiento computacional del lenguaje es la resolución de problemas observables en el comportamiento del nivel A (el lenguaje); lo cual es realizable utilizando un sistema de representaciones formales que, en principio y como marco de trabajo, puede ser independiente de modelos epistemológicos.

    En los modelos computacionales del significado habitualmente utilizados, como los que se manejarán en este trabajo, se asocia a los signos lingüísticos información codificada mediante representaciones formales tomadas de un metalenguaje y ancladas en algún nivel a entidades de un universo ontológico de referencia formado por símbolos denominados tipos. En este orden de cosas las representaciones de los signos lingüísticos pueden ser tomadas como los signos (nivel A de los diferentes modelos semánticos) y la ontología de referencia como un modelo del mundo extralingüístico (cuyo status comentaremos a continuación, pero que es asimilable en términos generales al nivel C de Frege en tanto que, por su propia naturaleza, no puede ser una representación objetiva del mundo, sino un modelo interpretado del mismo).

    En un sistema de representación computacional, el haz de información semántica asociada a cada signo lingüístico puede se tomado como el nivel B, interpuesto entre los signos y el universo de referencia. No es necesario a efectos de representación mantener una postura beligerante sobre la naturaleza epistemológica de dicha representación semántica. Basta con asumir simplemente que se trata de un nivel intermedio entre los significantes lingüísticos y el mundo extralingüístico, necesario a efectos explicativos. A grandes rasgos puede ser considerado como el significado en un sentido vagamente saussuriano, pero un realista podrá tratar dicha representación en términos de conjuntos (y definirlos por extensión o intensión); un platónico podrá verla como una abstracción o concepto; un fregeano como el 'sentido'; y un cognitivista como un modelo cognitivo.

    Desde este punto de vista, las representaciones computacionales del lenguaje pueden ser interpretadas, mediante el esquema triangular habitual, como en la fig. I.7.

    Con el fin de fijar la terminología que utilizaré en el resto del trabajo -en definitiva éste es el objetivo fundamental de este capítulo- es preciso considerar con mayor detalle el papel del nivel C o mundo del que son modelo las ontologías de tipos en los sistemas computacionales. Asumiremos en primer lugar que, como indica el sentido común, existe el llamado mundo real, o nivel de las entidades directamente aprehensibles a través de los sentidos y de los hechos o situaciones en que dichas entidades se ven inmersas. Asumiremos asimismo que es posible utilizar el lenguaje para aludir al mundo y así comunicarse o interaccionar con otros hablantes. A la relación que se establece en el proceso comunicativo entre las expresiones del lenguaje y las entidades o hechos del mundo le denominaremos referencia. Así, diremos que las expresiones 'Micifuz', 'aquel gato' o 'el gato de mi padre' refieren a una misma cierta entidad del mundo real.


Fig. I.7: Interpretación de las representaciones computacionales
en un esquema semántico triangular

    La adopción del término 'referencia' para indicar esta relación es, aparte de habitual, de clara estirpe fregeana; y es preciso recordar al respecto que en puridad los referentes de Frege no son objetos del mundo, sino a los conceptos bajo los que caen dichos objetos. En otras palabras, el nivel C de Frege no es el mundo real sino una clasificación del mismo. Lo mismo ocurre con el universo ontológico de referencia en los modelos computacionales: por tratarse de un modelo no puede ser sino una clasificación, en definitiva una interpretación, del mundo extralingüístico.

    Indudablemente, por múltiples motivos antes apuntados y ampliamente discutidos desde Aristóteles hasta nuestros días, la anterior asunción, con parecer razonable, es claramente insuficiente, ya que evidentemente no toda expresión lingüística tiene un correlato evidente en el llamado mundo real. Hasta este momento no hemos hablado de unicornios, y eso debe reputarse como un defecto grave para cualquier aproximación a la semántica, por generalizante que, como ésta, sea. Es evidente que, aunque en el mundo real no existen unicornios (ni los personajes de El Quijote; ni pueda demostrarse que existan los protones o la justicia; ni esté ni mucho menos clara la existencia objetiva del mes de septiembre), los humanos -especialmente los lógicos- hablan de unicornios (y también de Sancho Panza, de protones, de la justicia y del mes de septiembre).

    Lo más sensato al respecto es suponer que tal tipo de cosas, si no son del mundo (C), deben ser de B. Sin embargo habíamos reservado B para conjuntos, significados, intensiones, conceptos, o categorizaciones de entidades, no para entidades en particular; y nadie puede impedir que a alguien le apetezca hablar de ('referirse a') el unicornio de Ctesias, el cual dicen fue visto hacia el año 400 a.d.C. Dicho ejemplar de unicornio, por poco probable que sea su existencia, debe considerarse como perteneciente a la más general clase de los unicornios. Luego la expresión 'el unicornio de Ctesias', aparte de manejar el concepto [unicornio], implica algún tipo de referencia a un unicornio en particular. Pero referencia, ¿dónde?

    La solución de compromiso la hallaremos acogiéndonos a la muy veterana noción lógica de los mundos posibles. Asumiremos que los unicornios son entidades de C, un C que ciertamente no es el mundo de las cosas tangibles nuestras de cada día, pero que a efectos comunicativos funciona como si lo fuera. En privado admitiremos que el C de los unicornios no es más que una ficción, una construcción de la mente, pero desde el momento en que dicha ficción es (o puede llegar a ser) compartida por hablantes distintos -en caso contrario no podría existir la comunicación y el lenguaje perdería la función que hace que nos ocupemos de él-, asumiremos que los hablantes están de acuerdo en que una palabra como 'unicornio' tiene referencia en un universo (C) sobre el cual se puede hablar.

    Tal asunción coincide básicamente con la noción de 'espacio mental' (Fauconnier, 1994), constructo teórico que sirve de marco para la fijación de la referencia en gramática cognitiva. Desde esta óptica, por ejemplo, 'Sancho Panza' se tomará como una expresión con referencia en el universo o 'espacio mental' que conocemos como 'El Quijote'.

    A tal respecto, es digna de ser tomada en consideración la idea de que dichos 'espacios mentales' o 'mundos posibles' están construidos en la mente de los hablantes a imagen y semejanza del mundo real, de forma que la maquinaria fundamental de referencia al mundo real es aplicable a la de los mundos posibles.

    Un ejemplo muy ilustrativo de cómo conceptos y entidades no reales se construyen a partir de conceptos y entidades realmente perceptibles podemos hallarlo en el mundo literario de Lovecraft. Como es sabido, las criaturas de Lovecraft son de índole considerablemente mucho más alejada de cualquier referente real que, por ejemplo, los personajes de El Quijote; sin embargo, tal universo literario, pese a su extrema extravagancia, es transmitido al lector de forma que éste puede compartirlo (y éste a su vez referirse a él en conversación con otras personas, por ejemplo, pero no necesariamente, con otros lectores de Lovecraft); luego tal universo de referencia es susceptible de funcionar, en la comunicación lingüística, del mismo modo que el mundo real. ¿Cómo se consigue ello? Como podremos comprobar en el párrafo siguiente (descripción de un monstruo, extraída de 'El horror de Dunwich'), no de otro modo que por el recurso constante a la analogía con conceptos con referencia en la realidad:

    Es mayor que un establo... todo hecho de cuerdas retorcidas... tiene una forma parecida a un huevo de gallina, pero enorme, con docenas de patas... como grandes toneles medio cerrados que se echan a rodar... no se ve que tenga nada sólido... es de una sustancia gelatinosa y está hecho de cuerdas sueltas y retorcidas, como si las hubieran pegado... tiene infinidad de enormes ojos saltones... diez o veinte bocas o trompas que le salen por todos los lados, grandes como tubos de chimenea, y no paran de moverse, abriéndose y cerrándose continuamente... todas grises, con una especie de anillos azules o violetas... !Dios del cielo! !y ese rostro semihumano encima...!

    LOVECRAFT, H.P. (1925) El horror de Dunwich [tr. esp. en Alianza Editorial. Madrid, 1993].

    En todo caso, una representación computacional del léxico de una lengua debe aspirar a representar todo tipo de léxico, tanto el que se entiende como con posible referencia en el mundo real como el que designa cualquier otro tipo de entidad imaginaria o imaginable. Para ello, el modo de proceder sin quedarse atorado en disquisiciones filosóficas pasa por asumir que el universo de referencia en las representaciones computacionales (nivel C en la fig. I.7) incluye no únicamente a las entidades con existencia real sino también a aquéllas con existencia en cualquier otro mundo expresable mediante el lenguaje.

    En un sistema de representación basado en estructuras de rasgos como el que utilizaré, los rasgos utilizados para la descripción han sido definidos previamente, como se ha dicho, en una ontología de tipos, que se asume como un modelo -más o menos acertado, y sin duda, como mínimo, incompleto- de las clases de entidades que conforman el conocimiento compartido por los hablantes de una lengua. En consecuencia, por ejemplo, en dicho formalismo se podrá expresar sin mayores remordimientos filosóficos que Sancho Panza tiene brazos, cabeza y piernas; y que un unicornio es como un caballo pero con un cuerno en la frente; siendo suficiente que [brazo], [pierna], [caballo], [cuerno], [unicornio] o [Sancho Panza], sean tipos definidos en la ontología; y sin que tenga mayor relevancia el que tales conceptos sean susceptibles de tener referencia en el mundo real, en un espacio mental de Fauconnier, o en alguna otra especie de mundo posible. Como corolario, también dicho universo de referencia podrá (probablemente deberá) contener los objetos del metalenguaje utilizado en las representaciones.

    Veamos un ejemplo de dicho panorama en la fig. I.8, en donde una representación parcial de un sistema de tipos (nivel C) contiene el universo general que es modelo del mundo de referencia, incluídos objetos imaginarios -como los unicornios- y abstractos -como los objetos del metalenguaje, incluidos los signos lingüísticos (nivel A) y las representaciones semánticas a ellos asociados (nivel B)-.


Fig. I.8: Sistema de tipos (parcial) de una representación computacional

    Por supuesto debe constatarse que la categorización o clasificación de entidades no es un asunto que esté en absoluto claro; es más, es probable que no sea objetivamente decidible; pero, una vez más, confiaremos en que existe algún tipo de convenio implícito o convención al respecto que los hablantes de una lengua conocen y comparten; y en definitiva, las representaciones lingüístico-computacionales del mundo de referencia simplemente aspiran a ser un modelo de dicho conocimiento compartido que sea utilizable para un cierto número de aplicaciones de ingeniería del lenguaje.

    Sentado todo lo anterior, fijemos por fin los términos que en lo subsiguiente voy a emplear para referirme a los objetos de B y sus relaciones con A y C. Habrá que hacer al respecto una nueva precisión. Hasta ahora hemos venido hablando de forma genérica de los niveles A (lenguaje, signos, palabras), B (conceptos, significados) y C (mundo). Sin embargo es preciso distinguir entre la semántica léxica y la semántica de las expresiones en el discurso. La segunda se fundamenta en la primera. En el primer caso la intención es caracterizar objetos abstractos, informalmente, 'palabras' (como por ejemplo 'gato'), que pueden tomar diversas formas (por ejemplo, 'gatos'), que se suelen nombrar mediante una de sus formas, llamada 'lema' (por convención, en castellano, para nombres es la forma singular, para verbos la infinitiva, para adjetivos la masculina singular), y que son susceptibles de ser utilizadas bajo alguna de sus formas en las expresiones lingüísticas (como por ejemplo en 'el gato de mi padre'). Es preciso pues distinguir entre dos triángulos A-B-C, el lexicológico y el de las expresiones.

    · En el modelo de las expresiones (ver fig. I.9), siguiendo, como se ha dicho antes, de forma laxa a Frege, llamaremos a los elementos del nivel A, expresiones (p.e. 'el gato'); y a sus correspondencias en el mundo (nivel C), referentes. A las correspondencias de las expresiones de A en el nivel B las llamaremos conceptos o significado de A. No creo que sea precisa una denominación especial para la relación de correspondencia entre significados (B) y referentes (C), pero en todo caso si hay que mencionarla será también como una relación de referencia (desprendiéndose del contexto que se trata de una vía indirecta de referencia). En cuanto a convenciones de notación, en lo subsiguiente utilizaré la forma entre comas simples para el nivel A, una expresión entre corchetes para el B, y ninguna notación en particular para el nivel C. Así, diremos que la expresión 'el gato de mi padre' significa [el gato de mi padre]; y que 'el gato de mi padre' se refiere al gato de mi padre.


Fig. I.9: Terminología relativa a las expresiones

    · En el triángulo léxico-semántico (ver fig. I.10), denominaremos a los elementos de A (abstracciones de las formas posibles de las palabras, unidades de significado léxico) lexemas, siguiendo la tradición filológica habitual. A su relación con los elementos de B (conceptos o significados) la denominaremos, siguiendo a Lyons (1977), denotación. Aunque quizá de forma estricta no quepa considerar que exista relación entre los lexemas y los referentes o entidades del mundo (C), diremos que los lexemas refieren potencialmente a las entidades de C. Así, diremos que el lexema 'gato' (A), denota el concepto o categoría [gato] (B) y tiene la capacidad de referir en el contexto de una expresión a los gatos que en el mundo hayan (C).


Fig. I.10: Terminología relativa a los lexemas

    Con estas precisiones y la esperanza de que el contexto desambigue cualquier otro modo menos laxo de hablar (como por ejemplo llamar 'palabras' a los 'lexemas'), creo que podemos pasar a tratar del lenguaje, el mundo, los conceptos, y de sus representaciones computacionales.

2. Aproximaciones al conocimiento parte-todo
 


2.1 Enfoques léxico-relacionales: la meronimia
2.2 Aproximaciones constructivistas
2.3 Conclusiones
 


    En este capítulo presentaré las aproximaciones teóricas que han tratado, desde diversos puntos de vista, el tema del conocimiento parte-todo relativo a entidades -por tanto codificado en el lenguaje mediante nombres-. Dichas aproximaciones pueden dividirse en dos clases principales: léxico-relacionales y constructivistas.

    Las aproximaciones del primer tipo son de orden exclusivamente lexicológico, luego no toman en consideración el modo sintagmático de individuación en el lenguaje. En dicho marco se asume que el significado léxico viene determinado por las relaciones que cada unidad establece con el resto del lexicón, tomado en su conjunto como una gran red semántica. Se trata pues, de aproximaciones de clara raigambre estructuralista, con diferentes matices. Por una parte, los análisis de Lyons y Cruse son de orden lingüístico-descriptivo, evitándose la toma de compromisos teóricos acerca de la posible realidad mental de las unidades léxicas y de las relaciones que entre ellas se establecen. En su trabajo el análisis semántico se fundamenta de forma exclusiva en juicios de normalidad o anormalidad respecto a la aparición de las unidades léxicas en diversos contextos lingüísticos. Por contra, los investigadores situados en el marco de la psicolingüística (Miller y Johnson-Laird; Winston, Chaffin y sus colegas) postulan la existencia real en la mente de una estructuración relacional del conocimiento léxico-semántico. En ambos casos, la relación parte-todo, o de meronimia, es considerada como uno de los tipos fundamentales de estructuración del lexicón, el cual se superpone a la relación taxonómica (o de hiponimia) y es en cierto modo transversal con respecto a ésta (ver fig. II.1).
 


Fig. II.1: Taxonomía y Meronimia
 

    El autor que trata de forma más extensa y precisa las relaciones de parte desde un punto de vista estrictamente lingüístico es Cruse (1986), partiendo de las consideraciones previas de Lyons (1977). La aproximación de Cruse, sin embargo, no puede desligarse de los modelos psicológicos de la memoria léxica. Ciertamente, ni Cruse ni previamente Lyons reclaman para sus análisis status alguno de realidad mental; por contra, se basan únicamente en juicios de aceptabilidad lingüística de las palabras en contexto. Pero no debe pasar desapercibido el hecho de que el análisis de la meronimia de Cruse recoge los realizados en el campo de la psicolingüística anteriormente por Chaffin y Herrmann (1984), y simultáneamente por Winston et al. (1987); mientras este último, a su vez, se apoya ampliamente en el de análisis lingüístico de Cruse. Como tampoco que la aproximación de Winston et al. se enmarca en el modelo de la memoria léxica desarrollado por Miller y Johnson-Laird (1976); mientras que, ya en el campo de la representación computacional, WordNet, una base de datos que proclama basarse en principios psicolingüísticos -desarrollada por el equipo del propio Miller (Miller et al., 1990)-, utiliza para la definición de las relaciones léxicas, entre otros, los análisis lingüísticos de Cruse. Finalmente, una base de datos léxico-relacional que no prentende ser un modelo psicolingüístico sino puramente lingüístico, EuroWordNet, se fundamenta tanto en el trabajo lingüístico de Lyons y Cruse como en el piscolingüístico de Miller y Winston et al. (cf. Alonge et al., 1996; Climent et al., 1996).

    Como puede verse, en el campo de la semántica léxico-relacional, los modelos puramente lingüísticos y los psicolingüísticos se entrecruzan e incluso se solapan, nutriéndose los unos de los otros hasta formar, prácticamente, un cuerpo teórico único. Esta situación no debe resultarnos extraña, sino que por el contrario resulta habitual en lingüística. El lenguaje es una manifestación privilegiada de las facultades cognitivas del hombre; quizá, incluso, una de dichas facultades cognitivas; pero en todo caso, lenguaje y cognición humana son realidades inseparables. Por ello, no debe resultar en modo alguno insólito que descripciones lingüísticas y modelos psicolingüísticos guarden paralelismos e interaccionen entre sí.

    Los dos modelos principales de organización de la memoria léxico-conceptual son, según Saint-Dizier y Viegas (1995), el de Collins y Quillian (1972) y el antes citado de Miller y Johnson-Laird (1976). En la representación de Collins y Quillian la memoria léxica se estructura en forma de grafo, es decir, de nodos (conceptos) conectados por relaciones binarias de tipo lógico o asociativo ('y', 'o', ...). Dicha estructura se basa en el principio de economía organizativa, no previendo, pues, la existencia de redundancias en cuanto a conexiones y almacenamiento de la información, por lo que dicho modelo se ha visto invalidado a la luz de posteriores avances en el campo de la neurolingüística (p.e. vid. Damasio y Damasio, 1992) que parecen demostrar que la organización de la memoria no se rige por el principio de economía sino por el de eficiencia, con multiplicidad de conexiones y redundancias que permiten un acceso flexible a la información.

    El modelo de Miller y Johnson-Laird es compatible con la redundancia y la diversidad organizativa (cf. Miller et al., 1990). En su aproximación (ver fig. II.2) los conceptos son estructuras que median entre esquemas perceptuales, etiquetas léxicas e información gramatical asociada a estas últimas. Los esquemas perceptuales incluyen información sobre las características distintivas de los objetos (forma, color, dimensión, etc.) -extraídas a partir de la percepción y luego esquematizadas-, información funcional y posiblemente otros tipos de información mnésica. El significado de los conceptos se deriva en dicho modelo de las diferentes relaciones (Es-Un, Parte-De, ...) que establecen con otros conceptos. Las aproximaciones léxico-relacionales que, por lo que refiere a las relaciones parte-todo, describiré en este capítulo, se enmarcan dentro de este modelo.
 


Fig. II.2: Modelo de organización de la memoria de Miller y Johnson-Laird
 

    Las aproximaciones que trataré en la segunda parte de este capítulo, y que denomino constructivistas, difieren de las anteriores en que no se ciñen, como mínimo no de forma estricta, al estudio del significado en su vertiente puramente lexicalizada -en el que, de modo más o menos tácito, se toman a las unidades léxicas como punto de partida del análisis semántico-, sino que centran su estudio en las categorías mentales que, según se postula, subyacen al conocimiento lingüístico. En este tipo de aproximaciones no se aborda el conocimiento parte-todo como una mera relación paradigmática entre unidades léxicas. Por una parte, la corriente cognitivista considera que dicho conocimiento es uno de los mecanismos fundamentales que dan lugar a la formación de las categorías mentales (que ulteriormente serán expresadas mediante unidades lingüísticas). A partir del trabajo de Rosch (p.e. 1973, 1976) se introduce en los modelos de memoria léxico-conceptual la noción de prototipo, o ejemplo típicamente representativo de un concepto o de los rasgos asociados a un concepto. Dicha aproximación supone un notable cambio de enfoque respecto al tipo de información que dota de significado a los conceptos, al establecerse relaciones de proximidad entre éstos y ejemplares prototípicos de las categorías. En ella, además, los conceptos se construyen a partir de cierto número de rasgos, siendo un tipo fundamental de ellos, como veremos, los denominados rasgos de parte.

    Por otra parte, Jackendoff postula la existencia de rasgos conceptuales extralingüísticos susceptibles de dar cuenta de realizaciones lingüísticas en las que se ven implicados modos ciertamente sutiles de inclusión parte-todo -como la relación unidad-pluralidad, la relación entre una entidad y sus límites, o la relación entre una entidad y la sustancia que la conforma-. En el modelo de Jackendoff (p.e. 1992) no existe un componente léxico propiamente dicho, sino que se postula que el lexicón se halla distribuido en las reglas de correspondencia entre módulos mentales, p.e. entre las reglas que relacionan estructuras fonológicas y estructuras sintácticas; y entre estructuras sintácticas y estructuras conceptuales (ver Fig. II.3). Siguiendo la línea generativista, Jackendoff concibe la mente como una estructura modular secuencial, en la que cada módulo (p.e. fonológico, sintáctico, conceptual) recibe un input de un módulo previo y genera un output al módulo siguiente.

    Al igual que el modelo de Collins y Quillian, la estructura modular de la mente parece haber sido desmentida por los más recientes descubrimientos en materia de funciones corticales que, como he apuntado antes, sugieren una estructura en forma de red distribuida con múltiples interconexiones e interacciones entre todo tipo de nodos informativos. Sin embargo, el análisis de Jackendoff (1991) relativo a diversos aspectos de la información parte-todo es, como veremos posteriormente, susceptible de ofrecer explicación a diversos problemas de tratamiento del lenguaje, como por ejemplo el que desarrollaré en §7, las restricciones de selección de los nombres partitivos.
 


Fig. II.3: Modelo de la organización de la memoria de Jackendoff
 

    A pesar de las diferencias teóricas entre los diferentes modelos, a efectos de representación computacional del conocimiento léxico, las nociones de concepto lexicalizado que manejan todos ellos son igualmente representables en bases de representación del conocimiento. Resulta hasta cierto punto irrelevante desde el punto de vista de la formalización que el significado se defina en el modelo de Miller y Johnson-Laird mediante relaciones, y en el modelo cognitivista mediante rasgos, dado que, en una base de datos léxica, los rasgos pueden ser vistos como etiquetas de relación, y las relaciones como nombres para los rasgos. Tomemos por ejemplo los conceptos lexicalizados 'ave' y 'ala'. En WordNet -formalismo directamente basado en el modelo de Miller y Johnson-Laird- hallaríamos la representación parcial esquematizada a la izquierda de Fig. II.4; por otra parte, una representación basada en rasgos -como la utilizada en LKB (Copestake, 1992), formalismo que describiré y utilizaré más adelante- tomaría la forma que puede verse a la derecha de la misma figura. Como puede observarse, salvando divergencias teóricas, desde el punto de vista de cantidad de información representada y contenido de la misma, ambas representaciones son perfectamente equivalentes.

    En cuanto al modelo de Jackendoff, los elementos explicativos que en el mismo aparecen como primitivas conceptuales son, a pesar de enmarcarse en un modelo cognitivo totalmente dispar, igualmente representables en forma de rasgos y/o de nodos de la ontología de tipos en los formalismos de representación del conocimiento léxico y, en definitiva, asumibles como parte del conocimiento que comparten los hablantes.
 


Fig. II.4: Comparación de representaciones
 

    En todo caso, y a modo de corolario de esta introducción, es preciso hacer notar las aproximaciones de uno y otro tipo, léxico-relacionales y constructivistas, no deben ser consideradas como radicalmente disjuntas, sino que tienen diversos aspectos en común que podrían dar pie a otros modos de estructuración de este capítulo. El constructivismo y la aproximación psicolingüístico-relacional comparten la postulación de realidad mental para los constructos teóricos que se proponen. En particular, tanto el cognitivismo como la psicolingüística, con diferentes matices, asumen algún tipo de organización del significado léxico en el cerebro humano en forma de red distribuida multirrelacional. En otro orden de cosas, por lo que atañe a la posibilidad de formalización del conocimiento semántico para el procesamiento del lenguaje, tanto la aproximación psicolingüística como la de Jackendoff comparten una clara orientación en dicho sentido, dado que postulan la existencia de constructos semánticos -en el primer caso relaciones, en el segundo rasgos conceptuales- codificables en formalismos de representación del conocimiento lingüístico.

    Así pues, pasaré a continuación a describir en primer lugar en §2.1 las aproximaciones léxico-relacionales en lo que refieren al conocimiento parte-todo; y en segundo lugar en §2.2 veremos las aproximaciones constructivistas.

2.1 Enfoques léxico-relacionales: la meronimia.


2.1.1 Lyons
2.1.2 El enfoque psicolingüístico
2.1.3 Cruse
2.1.4 Recapitulación



    En esta sección describiré el enfoque léxico-relacional del fenómeno parte-todo, que comprende los problemas de la propia naturaleza de las relaciones de este tipo, su definición, sus clases, y el problema de la transitividad entre ellas. Examinaremos sucesivamente el análisis de Lyons, el psicolingüístico, y el de Cruse, para finalizar con una recapitulación de los aspectos más relevantes de todos ellos.

2.1.1 Lyons

    El primer trabajo relevante al respecto es el de Lyons (1977), quien parte de la concepción saussureana de la lengua como una estructura relacional, en el que las unidades lingüísticas (sonidos, palabras, significados) son tomadas como puntos de un sistema o red de relaciones. En dicho modelo, los constructos postulados para el análisis del lenguaje derivan de su mutua relación con otras unidades del mismo sistema lingüístico. Desde este punto de vista, se considera que una de las relaciones que estructura el léxico es la relación parte-todo.

    En primer lugar debe constatarse que no ofrece Lyons una definición formal de la relación parte-todo, aunque sí asume que la misma,

    "tal como se aprecia en los referentes de las expresiones [es] una relación establecida entre los componentes separados o separables de una cosa y la cosa entera de la que son componentes." (Lyons,1977)

    El principal objetivo del análisis de Lyons es dilucidar si la relación parte-todo es, como la hiponimia, transitiva; y apunta de entrada que el desacuerdo que dicha cuestión suscita indica de inmediato que

    "en la lengua existen diversos tipos de relaciones parte-todo." (op.cit.)

    Para el autor debe distinguirse, respecto a la transitividad, entre la que se establece en el vocabulario y la que se establece en el mundo, apreciando que

    "el hecho de que una entidad pueda describirse como parte de otra no implica, sin embargo, que se establezca una relación parte-todo entre los lexemas del vocabulario que se emplean para aludir a estas entidades." (op.cit.)

    Su conclusión al respecto es que mientras en el mundo, por lo que refiere a entidades físicamente discretas y a puntos o zonas del espacio-tiempo, tal relación es transitiva (en su ejemplo, si una empuñadura es parte de una puerta y una puerta lo es de una casa, una empuñadura es parte de una casa), en el lenguaje las relaciones parte-todo no necesariamente son transitivas: pueden serlo, pero no todas lo son, lo que deduce de la no aceptabilidad de frases como (1c) a pesar de la aceptabilidad de (1a,b):

                       (1) a. la empuñadura de la puerta
                        b. la puerta de la casa
                        c. * la empuñadura de la casa

    Lyons constata asimismo que es difícil diferenciar entre meronimia e hiponimia en el caso de relaciones léxicas en las que se ven implicadas palabras que no sean nombres cuantificables que denoten objetos discretos, p.e. nombres de masa o sustancia ('oro'), abstractos ('honradez'), o colectivos ('ganado'); o verbos que denotan actividades ('coser'). Así, 'oro' puede ser visto como un tipo de 'sustancia' o una parte de 'sustancia' ('esta sustancia contiene oro' frente a 'esta sustancia es oro'); 'honradez' como un tipo o una parte de 'virtud'; 'hilvanar' como un tipo o una parte (un subevento) de 'coser'; 'vaca' como un tipo o una parte de 'ganado'. Respecto a éste último caso, hace notar que, por contra, no es posible postular relación de hiponimia, y sí sólo de meronimia, entre 'oveja' y 'rebaño'. La razón recaería para Lyons en que los nombres de grupo, como 'rebaño', a diferencia de los colectivos como 'ganado', tienen una función individualizadora, similar a la de 'estanque' en relación a 'agua': 'rebaño' individualiza un conjunto respecto a individuales indiferenciados ('ovejas') de la misma forma que 'estanque' individualiza una cantidad de una sustancia ('agua').
 

2.1.2 El enfoque psicolingüístico.

    El equipo encabezado por Chaffin y Herrmann desarrolla a partir de las consideraciones de Lyons un marco explicativo de las relaciones meronímicas fundamentado en la experimentación psicolingüística. En dicho marco se trata las relaciones ya no simplemente como un medio para estructurar el léxico de una lengua sino además como entidades con realidad psicológica que constituyen el armazón de la memoria semántica de los hablantes, los cuales incluirían dentro de su competencia lingüística las capacidades de comparar, identificar y producir de forma creativa relaciones semánticas.

    La aproximación más relevante en dicho marco es la de Winston et al. (1987), que tiene su antecedente en el de Transue (1982), quien clasificó 31 términos que ocurren en el esquema "A es un X de B", agrupándolos en las cinco categorías mayores reflejadas en la tabla II.1.

    Tomando dicho trabajo en consideración, Winston et al. (1987) desarrollan su propio análisis de las relaciones léxicas parte-todo, llegando a las siguientes conlusiones generales:

    · la meronimia no es una relación sencilla sino una familia de relaciones
    · la meronimia es una clase de relaciones distinta de la inclusión espacial y de la inclusión entre clases
    · la transitividad no se propaga a través de tipos diferentes de relación meronímica.


Tabla II.1: Esquemas 'A es un X de B'

       En cuanto a la transitividad de la inclusión meronímica, los autores postulan la hipótesis de que, existiendo diversos tipos de meronimia, no puede darse la transitividad que implique tipos diferentes. Esta hipótesis da cuenta de las aparentes paradojas señaladas por Lyons (1977) y Cruse (1979) (cf. Iris et al., 1988). Así, la no aceptabilidad de (2c) se explicará por el hecho de que (2a) y (2b) son instancias de diferentes tipos de meronimia (respectivamente, Componente-Objeto y Miembro-Colección).

    (2) a. El dedo de Simpson es parte de Simpson
    b. Simpson es parte del Departamento de Filosofía
    c. *El dedo de Simpson es parte del Departamento de Filosofía

    Los tipos de relaciones meronímicas que Winston et al. (1987) postulan son los de la tabla II.2:
 

    Relación

    Ejemplo

    componente - objeto

    pedal - bicicleta

    miembro - colección

    barco - flota

    porción - masa

    rebanada - pan

    material - objeto

    acero - coche

    fase - actividad

    pagar - comprar

    lugar - área

    oasis - desierto

Tabla II.2: Modelo de Winston et al. (1987)

    Asimismo desarrollan la teoría (Teoría de los Elementos Relacionales) de que cada tipo de meronimia no es en sí una entidad unitaria o primitiva, sino que pueden ser descompuestas -y definidas- a partir de tres elementos de significado de orden más básico, o rasgos semánticos booleanos: ±Funcional, ±Homómero, y ±Separable. Las definiciones que ofrecen para dichos rasgos son las siguientes:

    · Funcional: las partes están o no en una posición espacial/temporal específica con respecto a las demás [partes del todo] , lo que sirve de base a su rol funcional con respecto al todo
    · Homómero: las partes son similares o no en naturaleza respecto a las demás [partes] y respecto al todo al que pertencen
    · Separable: las partes pueden o no ser, en principio, separadas físicamente del todo al que están unidas

    La combinación de dicho trío de pares de rasgos (o elementos relacionales) caracteriza cada tipo de meronimia, del siguiente modo:

    · Componente-Objeto +F -H +S
    · Miembro-Colección -F -H +S
    · Porción-Masa -F +H +S
    · Material-Objeto -F -H -S
    · Fase-Actividad +F -H -S
    · Lugar-Área -F +H -S

    Dichas tesis fueron desarrolladas posteriormente por Chaffin y Herrmann (1988), abundando en la idea de que las relaciones son conceptos abstractos compuestos de elementos relacionales, los cuales gozarían de entidad psicológica real -según demostraría la experimentación psicolingüística llevada a cabo por los autores-.

    Los elementos relacionales dan cuenta para Chaffin y Herrmann de las características de las relaciones meronímicas y de la capacidad del hablante para emitir juicios al respecto: cuántos más elementos compartan dos relaciones, más similares serán éstas entre sí. En un experimento previo (Chaffin y Herrmann, 1984) se ofreció a un grupo de sujetos un listado de 31 relaciones ejemplificadas mediante cinco pares de palabras cada uno, a fin de que las clasificaran de acuerdo con la similitud o disimilitud que juzgaran existían entre ellas. El resultado fue una jerarquía de similitud de relaciones, las cuales resultaron agrupadas en los cinco grupos mayores siguientes: Contrastes ('vivo'-'muerto'), Inclusión de Clase ('animal'-'caballo'), Similares ('coche'-'auto'), Casos ('pintor'-'pintar') y Parte-Todo ('coche'-'motor').

    Cada relación se definió mediante rasgos distintivos (tomados del trabajo de Stasio et al., 1985, quién a su vez las extrajo de diversas fuentes bibliográficas de los terrenos de la lingüística y la psicología). Para la familia parte-todo, los rasgos -o elementos relacionales- relevantes son:

    PR (Propiedad): Palabra2 es una propiedad de Palabra1
    PO (Posesión): P1 posee una propiedad o atributo
    A ('attachment' Conexión): P2 está conexa a P1
    H (Homogéneo): Las P2 son intercambiables
    S (Social): P2 es parte de P1 por acuerdo social
    L (Inclusión Locativa): P2 está "en" P1

    De acuerdo con dichos rasgos se clasificaron las relaciones parte-todo como un subconjunto de siete relaciones (de entre las 31 relaciones semánticas clasificadas), definidas y ejemplificadas del siguiente modo:

    · Objeto Funcional (árbol-hoja) PR, PO, A, C
    · Colección (bosque-árbol) PR, PO, H
    · Grupo (coro-cantante) PR, PO, H, S
    · Ingrediente (pizza-queso) PR, PO, L, C
    · Localización Funcional (dormitorio-cama) PR, PO, A, C
    · Organización (ejército-batallón) PR, PO, A, C, S
    · Medida (hora-minuto) H

    En un segundo estudio, la familia de relaciones parte-todo y similares fue afinada y detallada, resultando la clasificación reflejada en la tabla II.3.


Tabla II.3: Relaciones parte-todo en Chaffin y Herrmann (1988)
 

    Como se ha apuntado, dicho haz de relaciones se ordenó de forma jerárquica de acuerdo con la proximidad entre ellas (de acuerdo con la percepción de los sujetos del experimento). Los resultados más destacables de dicha ordenación son: (a) se percibe que el mayor grado de diferencia es el existente entre el grupo de relaciones de Material y el resto de relaciones; (b) de entre el resto de relaciones (todas excepto Material), el mayor grado de diferencia es atribuido a la relación Masa-Porción (ver fig. II.5).
 


Fig. II.5: Percepción de diferencias fundamentales entre relaciones de parte y
similares según los experimentos de Chaffin y Herrmann (1988)
 

    Hasta aquí hemos visto las líneas fundamentales de la aproximación psicolingüística. A continuación examinaremos la de Cruse (1986), que toma algunos aspectos de la misma y la extiende a partir de criterios más estrictamente lingüísticos.
 

2.1.3 Cruse

    Cruse (1986), al igual que Lyons, parte del axioma de que el significado de las unidades léxicas se refleja necesariamente en esquemas de comportamiento lingüístico; es decir, en juicios de normalidad o anormalidad aplicados al uso de tipos coherentes de palabras en contextos determinados, los cuales se toman como paradigmas reveladores de las propiedades léxico-semánticas. Por ejemplo, la posible relación de hiponimia entre 'oveja' y 'animal' o 'planta' vendrá determinada canónicamente por la normalidad o anormalidad de su uso en la expresión 'un/a X es un/a Y' ('una oveja es un animal', '*un animal es una oveja', '*una oveja es una planta').

    Para Cruse la meronimia es el segundo tipo principal de jerarquía léxica ramificante -tras la hiponimia-, y admite la plausibilidad de la hipótesis antropocentrista (ver más abajo 2.2.1) defendida por Lakoff y la corriente cognitivista, según la cual una percepción o conciencia primigenia de la estructuración parte-todo del propio cuerpo sería el detonante de la formación de una organización análoga del resto de categorías léxico-conceptuales.
 

    Relación de parte y relación de porción

    La distinción básica que hace es, dentro de la relación parte-todo que engloba a ambas, entre relación de parte ('part of') y relación de porción ('piece of'), diferencia que ilustra tomando como ejemplo una máquina de escribir. Con la ayuda de una sierra puede dividirse una máquina de escribir en un número indeterminado de trozos; sin embargo, para obtener sus partes deberá usarse un destornillador. Partes y porciones comparten las siguientes características: estabilidad topológica (no puede hablarse de una parte o una porción de vapor), continuidad espacial (una parte o una porción son entidades continuas), y relación topológica determinada de partes y porciones con sus todos y sus partes o porciones 'hermanas'. Por contra, difieren en las siguientes:

    · La relación porción-de es siempre transitiva; la parte-de no siempre lo es
    · Las partes son, en algún grado, autónomas; las porciones no (una parte de una máquina de escribir puede reemplazar a otra igual en otra máquina de escribir, o puede no haber formado parte nunca de ninguna y ser utilizada para la construcción de una máquina de escribir de nuevo cuño; pero un trozo de una máquina de escribir no será trozo de otra ni podrá usarse para la construcción de una de nueva)
    · Los límites de las porciones son arbitrarios, los de las partes no
    · Una parte tiene una función determinada con respecto al todo, una porción no.

    Esta última característica, la funcionalidad, es especialmente importante dado que es capaz de delimitar 'partes' sin que exista discontinuidad con el todo, p.e. 'la punta de la lengua' ('the tip of the tongue') deberá ser considerada 'parte' y no 'porción' en tanto tiene una funcionalidad definida.

    Asimismo, para Cruse la relación de porción no cristaliza en niveles léxicos debido a que las porciones no pueden ser agrupadas en subclases debido a la falta de una suficiente constancia de atributos.
 

    Definir la meronimia.

    Hasta aquí las consideraciones de Cruse no han sido de tipo lingüístico sino general. A partir de ellas, pasa al terreno estrictamente lingüístico. Una primera definición provisional de meronimia es:

    "the semantic relation between a lexical item denoting a part and that denoting the corresponding whole"

    ["la relación semántica entre un lexema que denota una parte y otro que denota el correspondiente todo"]  

(Cruse, 1986)

    A partir de ella debemos hacer notar dos cosas:

    (i) que la meronimia no incluye la relación de porción, sino únicamente la de parte;
    (ii) que no necesariamente toda relación de parte es meronímica -únicamente si dicha relación está lexicalizada-.

    La definición formal básica (que deberá ser ulteriormente precisada) de meronimia es, para el autor, la siguiente:

    X es un merónimo de Y si y sólo si oraciones de la forma "un Y tiene Xs / un Y tiene un X" y "un X es parte de un Y" son normales cuando las frases nominales "un X", "un Y" son interpretadas genéricamente.

    Así, para que exista meronimia debe poder juzgarse normalidad en ambos supuestos posibles ('un cuerpo tiene brazos' y 'un brazo es parte de un cuerpo'; pero nótese que: 'un hijo tiene una madre' / '*una madre es parte de un hijo').

    Hemos dicho que la anterior definición formal es la básica, sin embargo no la definitiva pues no cubre todo tipo de meronimias: por ejemplo, aunque 'sépalo' parece que debe ser considerado merónimo de 'flor', Cruse no juzga normal la oración '?una flor tiene sépalos' (debido a que no todas las flores tienen sépalos). En consecuencia, propone incluir un nuevo 'test' que permita aceptar como meronímica la relación 'sépalo'-'flor' y otras (que trataremos a continuación) que no tienen cabida en la definición básica:

    las partes de un Y incluyen el X/los Xs, el Z/los Zs, etc.

    Para el autor, la existencia de meronimias que no superan el test fundamental corrobora la tesis ya anteriormente formulada de que existen no una, sino una multiplicidad de relaciones meronímicas, las cuáles se deben a diversos factores, que trataremos más adelante.
 

    Transitividad de la meronimia

    Los principios más generales postulados por Cruse respecto a la transitividad de las relaciones parte-todo son:

    · La relación 'porción de' es inequívocamente transitiva (una porción de una porción de un todo es una porción del todo, p.e., un trozo de un trozo de pan es un trozo de pan); sin embargo, en la relación 'parte de' -lingüísticamente, la meronimia- deben cumplirse ciertas condiciones.
    · La condición principal que se debe cumplir para que una jerarquía meronímica sea transitiva es que, dado que existen muy diversos tipos de meronimia, la transitividad sólo existirá si la relación se mantiene dentro del mismo tipo (excepto, como veremos, en el caso de las 'partes unidas'). Este principio se formula únicamente de forma genérica, admitiendo el autor que es difícil de articular en muchos casos; sin embargo sí es útil para descartar relaciones obviamente mal formadas del tipo 'el dedo de Simpson es parte de Simpson; Simpson es parte del Departamento de Filosofía, luego el dedo de Simpson es parte del Departamento de Filosofía'.

    En relación con los ejemplos típicos de Lyons (1977) de existencia ('puño'® 'manga'® 'chaqueta') o inexistencia ('empuñadura'® 'puerta'® 'casa') de la transitividad, Cruse atribuye el segundo supuesto a tres tipos de factores.

    Por una parte, postula que la transitividad no se mantiene en el caso de las 'partes unidas', y sí en el de las 'integrales.' Así, siendo 'dedo' parte unida de 'mano' y 'mano' de 'brazo', será dudoso afirmar que '?un dedo es parte de un brazo'; pero sí podrá decirse que 'una rótula es parte de una pierna' ya que 'rótula' es parte integral de 'rodilla' y 'rodilla' lo es de 'pierna'. En los ejemplos de Lyons (1977), no se producirá la transitividad entre 'empuñadura' y 'casa' y sí entre 'puño' y 'chaqueta' por las mismas razones.

    Otro factor que determina la no aceptabilidad de 'una empuñadura es parte de una casa' es el de la polisemia lógica (en la terminología de Cruse, la subyacencia de un espectro de sentidos) de 'empuñadura': dado que el término es susceptible de referir a una gama diversa de objetos, aún cuando pudiera concebirse una casa con empuñadura (p.e. en el caso de una casa de juguete), dicho sentido -aunque estrechamente relacionado con el mismo- no sería exactamente el atribuible a 'la empuñadura de una casa'.

    Finalmente, '*una empuñadura es parte de una casa' tampoco es aceptable a causa de lo que Cruse denomina dominio funcional. Considera que las partes tienen típicamente una función más o menos determinada con respecto al todo; y en el caso que nos ocupa no es imaginable la función de una 'empuñadura' con respecto a una 'casa' (excepto en el supuesto de una casa de juguete). En cambio 'puño' sí tiene una función con respecto a 'chaqueta' -la misma que con respecto a 'manga', una función básicamente decorativa-, por lo que sí es aceptable la expresión 'el puño de una chaqueta'.
   

    Diferencias y similitudes entre taxonomías y meronimias.

    Para el autor ambos tipos de jerarquías léxicas, fundamentalmente y aparte de otras consideraciones marginales, se asemejan en que parecen responder a un mismo principio subyacente de subdivisión, y se diferencian en cómo se relacionan con los hechos extra-lingüísticos, pues las meronimias parecen estar más directamente relacionadas que las taxonomías con la realidad.

    Ambas, taxonomías y meronimias, implican para Cruse una especie de relación de inclusión por lo que parecen ser manifestaciones alternativas de un mismo principio: la subdivisión. Cada una de ellas daría cuenta de dicho principio atendiendo a un parámetro diferente. La taxonomía lo haría desde el punto de vista de la distintividad externa, es decir, basándose en el grado de similitud o disimilitud entre entidades por causa de atributos compartidos y no compartidos. La meronimia, por su parte, atendería al factor de cohesión interna de las entidades, es decir, a la oposición entre integridad física y desconexión. La consecuencia más directa de la similitud/disimilitud entre una y otra relación es que una taxonomía puede ser descrita como una relación parte-todo, pero no al revés.

    Por lo que respecta a las diferencias, para Cruse la fundamental es que 'la taxonomía es una jerarquía de clases y la meronimia una clase de jerarquías'. La meronimia trata de la estructuración de las partes (individuales) de cada entidad (individual), por tanto, como relación, es una clasificación de un haz de jerarquías (p.e., de todas las relaciones cabeza-cuerpo detectables en el conjunto de los cuerpos). Advierte sin embargo, que ello no debe hacer presuponer que la meronimia es puramente un asunto de la realidad, sino que es primordialmente léxico-semántico (como es de observar a partir de los diversos fenómenos antes relatados de facultatividad, espectros de sentidos, etc.) ya que se fundamenta no en la realidad en sí sino en la atribución de etiquetas léxicas a partes o grupos de atributos de la realidad.
   

    Tipos de meronimia: Meronimias Central y Periférica

    La distinción básica que sienta Cruse es entre el tipo de meronimia que considera central y los tipos periféricos o cuasi-meronímicos. La primera es la relación existente entre partes y todos de entidades físicas cohesionadas y tangibles; la segunda clase incluye relaciones entre nociones tales como colectividades, entidades abstractas, masas, etc. Ambos tipos se abordan por separado y dentro del tipo central se tienen en cuenta dos tipos de factores: en primer lugar factores de interferencia de niveles; y en segundo los diversos tipos de cohesión parte-todo -a fin de seguir la descripción, véase a continuación la tabla II.4-.

    I. Meronima central: entidades fisicas. Diversos factores diferenciales motivan la existencia de diversos tipos entrelazados de relación meronímica (incluso dentro del propio tipo central). El primer paquete de factores tiene que ver fundamentalmente con el hecho de que las taxonomías meronímicas no muestran una organización clara en niveles coherentes sino diversos grados de interferencia y solapamiento entre ellos. Describiremos en primer lugar dicho haz de factores, y a continuación otros dos relativos el tipo de cohesión existente entre las partes de las entidades.

    Factores de interferencia de niveles en el tipo central de meronimia. Un grupo de cuatro factores: opcionalidad, congruencia, espectro de sentidos y holo-meronimia, es la causa de que diversas relaciones parte-de no superen, o lo hagan de forma dudosa, los tests de meronimia estricta que sirven de definición de la relación. Los describiré someramente a continuación.


Tabla II.4: Clasificación de los tipos de meronimia según Cruse (1986)

 
    (a).- Posible opcionalidad de la relación.

    Este criterio contempla el hecho de que una parte lo sea de un todo (o un todo tenga a algo por parte) de forma necesaria, o bien de forma opcional. Así, una flor, opcionalmente -pero no necesariamente- tiene sépalos; y ello es lo que invalida la expresión '?una flor tiene sépalos', pero no 'un sépalo es parte de una flor'.

    La combinación de las condiciones de opcionalidad y obligatoriedad en cualquiera de los dos sentidos de la relación ('X es merónimo de Y', 'Y es holónimo de X') da lugar a cuatro tipos de meronimia:

    (a1).- canónica/canónica (p.e. 'brazo'-'mano', pues una mano es necesariamente parte de un brazo y un brazo necesariamente tiene una mano)

    (a2).- facultativa/facultativa (p.e. 'universidad'-'museo', dado que un museo puede ser parte de una universidad y una universidad puede tener por parte a un museo, pero no necesariamente un museo es parte de una universidad ni una universidad tiene por parte a un museo)

    (a3).- facultativa/canónica (p.e. 'editorial'-'periódico': un periódico no necesariamente tiene editorial -en el sentido de artículo de opinión, no de empresa editora-, pero un editorial es necesariamente parte de un periódico). Otro ejemplo sería 'tejado'-'casa': no todas las casas tienen tejado, pero un tejado siempre lo es de una casa.

    (a4).- canónica/facultativa (p.e. 'líquen'-'hongo', ya que al parecer un líquen necesariamente tiene por parte a un hongo, pero un hongo puede tener existencia autónoma y no necesariamente es parte de un líquen).

    (b).- Congruencia.

    Este factor es parecido al de la opcionalidad de la relación pero no idéntico a él. La diferencia se halla en que en el caso de la opcionalidad se considera que cualquier ejemplar del holónimo puede o no estar en relación con el merónimo, o viceversa (p.e., cualquier periódico puede tener o no editorial); sin embargo en el que nos ocupa ahora la opcionalidad no es libre sino condicionada a un subtipo específico (p.e. no cualquier flor puede o no tener sépalos, sino que ciertas flores necesariamente los tienen y otras necesariamente no los tienen).

    Esta característica da lugar básicamente a dos tipos de holonimia/meronimia: aquél en que el merónimo es más general que el holónimo (p.e. 'nail' ('uña'), en relación a 'finger' ('dedo de la mano') y 'toe' ('dedo del pie'), puesto que 'nail' es merónimo tanto de uno como de otro pero no de forma indiscriminada, las uñas de los dedos de las manos son diferentes de las de los dedos del pie; y aquél en que el holónimo es más general que el merónimo (p.e. 'flor'-'sépalo' y 'cuerpo'- 'útero', dado que un cuerpo tiene o no útero dependiendo de si es femenino o masculino).

    La terminología utilizada por Cruse al respecto es la siguiente: 'dedo' es super-merónimo de 'mano' y 'pie', y éstos son hipo-holónimos de 'dedo'; 'cuerpo' es super-holónimo de 'útero', y éste hipo-merónimo de 'cuerpo'.

    (c).- Espectro de sentidos relacionados.

    Es el caso del típico ejemplo de Lyons (1977) 'puerta'-'empuñadura' ('door'-'handle'). Este factor hace que sea dudoso afirmar que '?a handle is a part of a door', pero no que 'a door has a handle'. 'Handle' debería considerarse un super-merónimo de 'door', dado que puede hablarse de 'handles' de puertas, de cajones y de cucharas; pero considera Cruse que, de forma más precisa, lo que ocurre es que existen varios sentidos para 'handle' estrechamente relacionados, uno de los cuales sería [empuñadura de puerta], otro [empuñadora de cajón] y otro [mango de cuchara].

    (d).- Holo-meronimia.

    Se da cuando un término puede denotar alternativamente la parte de un todo, o el todo en sí. Es el caso de 'blade' (aproximadamente, 'brizna', u 'hoja' en sentido restrictivo, es decir, la hoja sin el tallo), que puede ser merónimo de 'leaf' ('hoja') si la hoja tiene tallo, o denotar la hoja entera si no lo tiene. Un ejemplo en castellano de holo-meronimia es la relación existente entre 'piso' y 'casa' -en su sentido de [morada, lugar donde uno vive]-: un piso puede ser una parte de la casa (si ésta tiene planta baja y piso/s) o toda la casa en sí.

    Diferentes tipos de cohesión parte-todo en el tipo central de meronimia. Cruse expone dos tipos de oposición que tienen que ver con formas divergentes de integración de la parte en el todo:

    (a).- Partes unidas vs. partes integradas.

    El ejemplo prototípico de dicha diferenciación es la existente entre 'palma' y 'dedo' respecto a 'mano'. La palma es una parte integrada, no separable, de la mano: no puede concebirse una mano sin palma y las expresiones '*una mano sin palma' o '*la palma está unida a la mano' no son admisibles. El dedo, sin embargo, es separable de la mano: una mano es concebible aunque le falte algún dedo, y las expresiones 'una mano sin dedos' o 'el dedo está unido a la mano' son aceptables. La noción fundamental subyacente a esta distinción es que un todo no queda destruido si le falta una 'parte unida', y sí si le falta una 'parte integral'.

    (b).- Partes sistémicas vs. partes segmentales.

    Tomando nuevamente como ejemplo el cuerpo humano, consideraremos que 'cabeza', 'brazos', etc. son partes segmentales y 'nervios', 'músculos', 'arterias' etc. partes sistémicas. Las primeras están dispuestas de modo secuencial, se desarrollan a lo largo de los ejes espaciales mayores de un todo y muestran un mayor grado de cohesión espacial; las segundas son topológicamente interpenetrantes y muestran una mayor unidad funcional y de constitución que las primeras. Apunta Cruse que el lenguaje ordinario tiene mayor preferencia por dividir un todo en partes segmentales.

    II. Clases no centrales de meronimia. Describe Cruse una pléyade de relaciones parte-todo que, aunque no considera sean en sentido estricto meronimias, sí pueden ser vistas como cercanas o similares a ella. Son las siguientes:

    (a).- Lugares incluídos en los límites de otros lugares, como p.e. Francia:Europa. Considera que son más 'porciones' que 'partes', como demuestra la inaceptabilidad de '*Europa tiene Francia', y deben tomarse más como aspectos terminológicos peculiares que como relaciones parte-todo. Sin embargo, añade, ello no es tan claro en una relación del tipo capital:país, ya que sí es aceptable 'un país tiene una capital'.

    (b).- Partes de entidades con estructura temporal, como 'strip-tease:show', 'movimiento:sinfonía'. Todo suceso que tenga una duración en el tiempo es susceptible de ser dividido en partes, denominadas 'estadios' o 'fases'. Como en el caso de las entidades, pueden ser segmentales (caso de 'movimiento'-'sinfonía') o sistémicas ('strip_tease'-'show').Tambien pueden considerarse relaciones de orden más periférico como partes de estados ('autocontrol'-'madurez', 'el autocontrol es parte de la madurez') o rasgos típicos de eventos ('calor'-'verano', 'el calor es parte del verano').

    (c).- Medidas, como 'gramo'-'kilo'. Cruse no considera esta relación como estrictamente meronímica por no ser ramificante. La característica principal es la total falta de diferenciación entre las partes (un gramo es exactamente igual a otro gramo)

    (d) Colectividades, como 'tribu', 'clero', 'bosque' o 'rebaño'. Este tipo de entidades está menos integrado estructuralmente que los objetos, y sus partes son todos independientes -y a menudo indiferenciados- de un tipo más básico. Distingue Cruse entre cuatro tipos de relaciones colectividad-miembro:
 

    (d.1).- Grupo-Miembro, como en 'tribu', 'equipo', 'comité', 'familia', 'orquesta' o 'público'. Parecen restringidos a asociaciones de humanos y suelen designar un propósito o función común de la colectividad. En algunos casos existen nombres específicos para los elementos del grupo ('músico', 'senador'). Se caracterizan morfosintácticamente en inglés por admitir el plural ('teams' -'equipos'-) y poder concordar con el verbo indistintamente en singular o plural ('the team is/are under investigation').

    (d.2).- Clase-Miembro, como en las relaciones 'proletariado'-'trabajador', 'clero'-'obispo' o 'aristocracia'-'duque'. En este caso la agrupación está justificada más por atributos comunes que por la función de la colectividad; es orgánicamente menos cohesiva que un grupo y sus miembros son menos claramente partes que los elementos de grupos. Morfosintácticamente, parecen rechazar el plural (?'aristocracies') y prefieren la concordancia en plural ('the aristocracy were/?was unhappy').

    (d.3).- Colección-Miembro, como en 'bosque'-'árbol', 'montón'-'piedra' o 'biblioteca' (en el sentido de colección, no de lugar)-'libro'. Son típicamente agrupaciones de objetos inanimados. La relación de miembro a colección suele ser facultativa y la inversa necesaria (un árbol no tiene por qué ser parte de un bosque, pero un bosque está formado por árboles). Los nombres de colección son pluralizables ('forests' -'bosques'-), pero si están en singular no pueden concordar con el verbo en plural ('the forest is/*are necessary')

    (d.4).- Grupo de Animales-Animal ('rebaño', 'piara'). Para Cruse esta relación es intuitivamente diferente de la de grupos de humanos ya que el nombre de la agrupación comparte propiedades morfosintácticas de las relaciones de Grupo y de Colección, ya que en inglés '?the herd are...' -'el rebaño son...'- no parece aceptable, pero 'the (wolf) pack have...' -'la jauría (de lobos) han...'- sí lo es.

    (e).- Ingredientes o constituyentes ('acero'-'coche', 'café'-'café con leche'). Se caracterizan porque la parte es un nombre de masa, y refiere a sustancias usadas en la preparación del todo o que forman parte de su composición.

    (f). Partículas de sustancias ('grano'-'arena'). En este caso el nombre de masa es el todo, mientras que la parte es contable. Sucede cuando el todo es una sustancia que, examinada con detalle, resulta estar compuesta de partículas.

    Hasta aquí hemos visto el análisis de la meronimia hecho por Cruse. Examinemos en la sección siguiente cuáles son las líneas generales de las aproximaciones relacionales en las que ésta se incluye.
 


  2.1.4 Recapitulación

    A pesar de que los autores relacionados hasta aquí siguen dos líneas distintas de definición de las relaciones meronímicas -los lingüistas, a partir de tests de aceptabilidad; los psicolingüistas, a partir de elementos conceptuales abstractos subyacentes-, todos ellos concuerdan en afirmar que no existe una sola sino una vasta familia de relaciones léxicas parte-todo. Definir las propiedades de transitividad de las mismas parece ser algo difícil de articular. Winston et al. postulan que la relación parte-todo es transitiva mientras se mantenga dentro de un mismo subtipo; sin embargo Cruse hace notar la dificultad de mantener tal aseveración en todos los casos.

    La multiplicidad de clasificaciones ofrecidas y la heterogeneidad de los factores que en ellas se manejan parece ser reflejo de la dificultad de llegar a una delimitación clara de los diferentes tipos de relaciones meronímicas. Con el paso del tiempo, la clasificación que ha adquirido mayor grado de consenso (cf. Saint-Dizier y Viegas, 1995), quizá por ser la que propone un número más reducido y general de tipos y una mayor claridad de definición de los mismos, es la de Winston et al. (1987), que repito a continuación:

    • componente / objeto integral (relación estructural y funcional clara antre el todo y las partes)
    • miembro / grupo o conjunto (no existe necesariamente relación estructural o funcional entre el todo y las partes)
    • porción / masa (similaridad estructural total entre el todo y las partes; los límites de las partes son arbitrarios; no existe relación funcional entre las partes y el todo)
    • objeto / material (describe los ingredientes o materia constitutiva de un todo)
    • fase / actividad o proceso (describe una relación parte-todo temporal)
    • lugar / área (relación parte-todo locativa; la parte no es funcional respecto al todo)

    Esta clasificación, como veremos en el capítulo siguiente, es la que sirve de base a los modelos computacionales de representación del conocimiento léxico WordNet y EuroWordNet.

    En muchos aspectos, quizá debido a su voluntad generalizante, la clasificación de Winston et al. resulta demasiado esquemática, debiendo ser tenidas en cuenta diversas apreciaciones de Cruse, de las que cabe destacar como más relevantes las siguientes:

    • Existen múltiples factores que interfieren en la tarea de establecer relaciones meronímicas unívocas y bien definidas, siendo los más destacables diversos grados de opcionalidad de las relaciones, así como, inevitablemente, los diversos grados de polisemia a que se hallan sujetos los lexemas que son términos de las mismas.

    • Desde el punto de vista lingüístico, es difícil fijar un conjunto claro y bien definido de tests de aceptabilidad que den cuenta de forma clara y discriminativa de la relación parte-todo en general y de sus diversos subtipos.

    • La relación establecida entre (nombres denotadores de) objetos físicos tangibles y sus partes estructurales son concebibles como el ejemplo central de relación meronímica, siendo los demás tipos de meronimia de orden marginal o secundario.

    • Parece necesario establecer una distinción entre relaciones meronímicas (o de parte) y relaciones de porción. Para Cruse la distinción fundamental entre ambas debe hallarse en que las partes tienen una función distintiva respecto al todo, y los porciones no. Un segundo criterio a tener en cuenta es el de delimitación: los límites de las partes son motivados y los de las porciones, arbitrarios.

    • Un aspecto a ser tenido en cuenta es el de la lexicalización de las relaciones parte-todo. Para Cruse las relaciones de porción no lexicalizan y las relaciones meronímicas sí.

    Esta última afirmación, como veremos ampliamente más adelante, es discutible. Tanto la clasificación de Cruse como las diversas clasificaciones del equipo de Chaffin y Herrmann contemplan relaciones meronímicas del tipo 'grano' / 'arroz' o 'rebanada' / 'pan', las cuales no pueden ser consideradas en puridad como relaciones parte-todo lexicalizadas, sino que más bien los nombres de parte ('grano' y 'rebanada') parecen ser, más que nombres de objetos, predicados nominales susceptibles de ser aplicados, respectivamente, bien a c