Monografias | Individuación e información Parte-Todo Representación para el procesamiento computacional del lenguajeIndividuación e información Parte-Todo Representación para el procesamiento computacional del lenguajeResumen: En la comprensión del lenguaje juegan un papel determinante las relaciones tácitas que se establecen entre los distintos significados denotados por las unidades lingüísticas. ÍNDICE El mundo era tan reciente, que
muchas cosas carecían de nombre, GABRIELGARCÍA
MÁRQUEZ: En la comprensión del
lenguaje juegan un papel determinante las relaciones tácitas que se establecen
entre los distintos significados denotados por las unidades lingüísticas.
Tomemos por ejemplo el primer párrafo de 'El largo adiós', de Raymond
Chandler:
La primera vez que
posé mis ojos en Terry Lennox, éste estaba borracho en un Rolls Royce
Silver Wraith, frente a la terraza de The Dancers. Simplemente a partir de
ese primer párrafo, el lector puede hacerse la siguiente composición de lugar:
un tal Terry Lennox se hallaba en el interior de un coche, el cual se hallaba
situado frente a un bar o restaurante. Las inferencias son posibles debido a que
el lector tiene conocimiento de que (1) un Rolls Royce es un coche; y (2) una
terraza es -en el sentido que resulta apropiado en el texto- la parte exterior,
de cierto tipo de locales públicos. La inferencia (1)
es debida, a grandes rasgos, a la relación semántica comúnmente conocida como
relación Es-Un (o de Hiperonimia/Hiponimia); en este caso concreto, a una
variante específica, la relación Instancia-De. Dicha relación ha sido
ampliamente estudiada y cualquier tipo de lexicón para el tratamiento del
lenguaje está organizado en mayor o menor medida basándose en la misma. La inferencia (2)
es debida a la relación conocida como parte-todo (o de Meronimia/Holonimia). De
este segundo tipo de relación semántica es del que trataremos aquí. Otro aspecto del
fenómeno puede ser ilustrado a la vista del inicio del capítulo 14 de la misma
novela:
A la mañana
siguiente me estaba limpiando el talco del lóbulo de la oreja cuando sonó
el timbre. Fui a abrir la puerta y me topé con un par de ojos azul violeta. En este caso la interpretación es
que Marlowe, presumiblemente, ha abierto la puerta a una persona. Dicha
interpretación es posible, en gran parte, a causa de una metonimia: los ojos
son una parte del cuerpo; concretamente una parte del cuerpo que tiene una
palabra específica para denotarla, 'ojo'. Pero no todas las partes de cosas
pueden ser denotadas mediante una sola palabra. El 'lóbulo de la oreja', por
ejemplo, es tan parte del cuerpo, como pueda serlo un 'ojo', y, al menos en
castellano, se describe no mediante una sola palabra sino mediante una paráfrasis:
un grupo nominal del que sobresalen un nombre que hace relación al todo,
'oreja'; y otro que hace ciertas precisiones sobre la parte en cuestión, 'lóbulo'
-"cada una de las partes, a manera de ondas, que hacen saliente en el borde
de una cosa; como en la hoja de una planta" (Casares, 1959)-. A este tipo de
relación parte-todo, no léxica sino compositiva, le dedicaremos aquí una
atención especial. 0. Introducción En este trabajo
me he propuesto tratar de la codificación en el lenguaje del conocimiento
parte-todo y de su representación computacional. Me ceñiré a la semántica léxica
nominal del español, e intentaré dar, en dicho ámbito, con un tratamiento
global e unificado del fenómeno. Se trata de un
tema aparentemente heterogéneo, dado que abarca aspectos tales como la
meronimia (o relaciones parte-todo entre lexemas), la pluralización (o expresión
morfológica de una relación de elemento a multiplicidad), la polisemia lógica
(como en la alternacia léxica entre la denotación de una entidad y la de la
sustancia que la conforma), o los sintagmas partitivos (o expresión no léxica
de relaciones parte-todo). Mi hipótesis es que todo ese abanico de fenómenos
lingüísticos corresponde a un único y reducido conjunto de esquemas
cognitivos, y puede ser explicado y representado en base a los mismos. En lo que resta
de capítulo plantearé mi aproximación genérica al tema, para concluir con la
presentación del esquema del trabajo.
Planteamiento La capacidad de
referirse a entidades como unidades discretas y diferenciables es un mecanismo
del que, muy probablemente, cualquier lenguaje existente o concebible deba
disponer. Algunos autores, como Lyons (1977), han denominado a dicho mecanismo,
mediante el cual las lenguas entresacan entidades individuales de un continuum
de referencia, individuación. De forma genérica, entenderemos por
individuación la capacidad que tienen los hablantes para referirse a una
determinada entidad o suceso de forma distinta y separada de un todo más
inclusivo del que se concibe que forma parte. Con las debidas
matizaciones, puede convenirse que el objeto de la comunicación humana, el
mundo que nos rodea o cualquier otro mundo posible o imaginable, está
conformado por una amalgama más o menos continua de entidades y sucesos que es
preciso desbrozar para que la propia comunicación sea posible. Centrándonos en
el caso de la individuación de entidades, se observa que las lenguas utilizan múltiples
recursos para llevarla a cabo. En español, por ejemplo, puede usarse la
referencia deíctica ('aquéllo') u otros pronombres ('él'), así como una gran
variedad de sintagmas nominales ('dos árboles', 'una rama', 'muchas copas de
vino', 'ese equipo', 'un montón de gente', 'una cabeza de ganado'). Otras
lenguas utilizan recursos ligeramente diferentes; por ejemplo las lenguas con
clasificadores (japonés, chino mandarín, thai) construyen la referencia
individualizada mediante grupos nominales en los que el nombre o su
especificador combinan con un morfema o lexema, denominado clasificador, el cual
tiene una doble función: la de indicar que la entidad denotada es una entidad
discreta y contable, y la de clasificarla de acuerdo con ciertas
especificaciones semánticas y perceptuales, tales como tipo, forma, animacidad,
consistencia, tamaño o disposición. Dichos clasificadores, utilizados en
ausencia del nombre, tienen, como los pronombres en español, capacidad de
referencia anafórica. De acuerdo con la
corriente teórica habitualmente denominada gramática cognitiva, en el
origen de la mencionada capacidad de individuación, se halla la capacidad de categorización.
Desde dicho punto de vista (p.e. vid Lakoff, 1987; Rosch, 1976),
determinados elementos del continuo son percibidos por los hablantes como
propietarios de rasgos recurrentes, por lo que son considerados como
pertenecientes a una categoría conceptual. Por ejemplo, observado que la gran
mayoría de las cosas a las que en castellano se denominan 'árbol' presentan en
su parte superior un número indeterminado de apéndices en los que se situan
las hojas y los frutos, es posible convenir que, pese a la gran diversidad de
aspectos que ofrecen y a que físicamente forman una única unidad continua con
el árbol, tales apéndices pueden reputarse como pertenecientes a una categoría
de cosas, que en castellano recibe el nombre de 'rama'. La expresión
lingüística de las categorías conceptuales está directamente relacionada con
el fenómeno de la convencionalización, y por consiguiente con múltiples
factores dependientes en último término de cada lengua en particular: cada
lengua designa a los diversos rangos de entidades y sucesos de acuerdo con los
mecanismos de que dispone. El grado máximo de convencionalización es la lexicalización,
o expresión de un determinado concepto en una lengua mediante un determinado
lexema. Grados menores de convencionalización resultan en la expresión de un
concepto mediante construcciones expuestas a diversos grados de variabilidad,
desde expresiones complejas prácticamente invariables, como las lexías, hasta
estructuras sintagmáticas sujetas a un mayor o menor espectro de realizaciones
alternativas, tanto en lo relativo a su estructura como a los elementos léxicos
que en ella pueden insertarse. Sea de forma
lexicalizada o sintagmática, diversos tipos de entidades pueden ser referidos
de forma discreta e individualizada: individuos ('un árbol', 'un palo');
conjuntos o pluralidades de individuos ('una manada de elefantes', 'un comité',
'gente', 'personas'); cantidades de masas o substancias ('un vino', 'un vaso de
vino', 'una madera', 'una barra de madera'); o partes, porciones o elementos de
entidades individualizadas ('una rama', 'la cima de una montaña', 'una cabeza
de ganado', 'uno del equipo'). De modo íntimamente
relacionado con la anterior apreciación, se constata que pueden definirse
diversos tipos de relaciones de inclusión entre entidades (o, desde otro punto
de vista, entre expresiones que las designan), como por ejemplo las existentes
entre 'árbol' y 'rama', 'manada de elefantes' y 'elefante', 'barra de madera' y
'madera', o 'animal doméstico' y 'ganado'. Se trata éste de un tipo de
conocimiento del que disponen los hablantes y que es profusamente utilizado en
la construcción del significado del discurso lingüístico; por ejemplo, en una
emisión lingüística en la que se manejen conceptos o palabras tales como
'ramas', 'copa', 'fruto', 'hojas', 'raíces', 'savia' o 'bosque', un hablante
del español podrá deducir que, aunque no se cite de forma explícita, se está
hablando de árboles. Tal tipo de
información semántica, la información parte-todo, ha sido estudiada en
profundidad desde el punto de vista lexicalista por autores como Cruse (1986) o
Winston et al. (1987), los cuáles han postulado diversos tipos de
relaciones entre todos y partes, o relaciones meronímicas, entendidas
como uno de los medios de estructuración interna del lexicón. Dichas
aproximaciones, por ser esencialmente léxico-semánticas, no abordan de manera
directa el hecho de que las relaciones parte-todo no únicamente se realizan en
el lenguaje en forma de relaciones tácitas entre lexemas, sino que también,
como he sugerido antes, pueden ser expresadas a partir de unidades lingüísticas
más complejas. Por ejemplo, un caso de individuación que da lugar a una relación
meronímica nominal, como es el de 'meandro' respecto a 'río', es perfectamente
análogo al que establece el sintagma 'brazo de río' en relación al mismo tipo
de entidad global: en ambos casos se designa a una parte del río concebida como
una entidad individual y diferenciada. Este tipo de
grupos nominales partitivos, como 'brazo de río', -compuestos de un
nombre en función partitiva, la preposición 'de' y un nombre en posición de
complemento que designa la entidad global de referencia-, constituyen uno de los
modos fundamentales de denotación de categorías conceptuales no lexicalizadas
en español, y realizan funciones semánticas análogas en muchos aspectos a las
que realizan los nombres comunes, como por ejemplo la de establecer relaciónes
parte-todo entre entidades; pero no únicamente éstas, sino que, del mismo modo
que los clasificadores en otras lenguas, también aportan información de otros
tipos (forma, magnitud, etc.). El análisis de
las construcciones partitivas en español y de sus clases nos llevará a
examinar qué tipos de nombre pueden ocupar en diferentes casos cada una de las
posiciones del sintagma. La observación de la posición del complemento y el
objetivo de definir sus características semánticas conducirá a su vez al
planteamiento un problema de polisemia nominal que denominaré polimorfismo
referencial. Tómense en
consideración dos sintagmas partitivos como 'un montón de café' y 'un montón
de cafés', en los que en ambos casos se formula una cuantificación respecto a
un todo de referencia -café- pero con diferentes matices de significado. El
primer sintagma es monosémico: en él se cuantifica en relación a la sustancia
denominada 'café'. El segundo sintagma, en cambio, es ambiguo, y, además, en
él el todo de referencia es semánticamente distinto del del primero:
'un montón de cafés' podrá referirse, bien a tazas -o dosis convencionales-
de café (como en 'para mantenerme despierto tomé un montón de cafés'), bien
a clases -o subtipificaciones de la clase genérica- de dicha sustancia (como en
'en el nuevo supermercado puedes elegir entre un montón de cafés'). La situación
que sugieren los anteriores ejemplos es la siguiente: un mismo lexema es
susceptible de denotar conceptos que son distintos, pero que sin embargo se
hallan estrechamente relacionados tanto entre sí como con lo que pudiera
considerarse un significado común básico subyacente a todos ellos. Éste y otros
tipos similares de lo que podría calificarse como fenómenos de polisemia débil
-denominados polisemia lógica por diferentes autores, como Pustejovsky
(1995)- constituyen un fenómeno del que es preciso dar cuenta en el lexicón
por las múltiples implicaciones semánticas que plantea, entre las que se
cuenta la caracterización de los referentes de las construcciones partitivas,
pero también otros aspectos del fenómeno parte-todo como la alternancia
sustancia-entidad ('cordero' como animal vs. 'cordero' como plato o alimento) o
la pluralización (expresión de una relación de elemento a multiplicidad). A lo largo de
este trabajo analizaré los aspectos de la semántica nominal hasta aquí
planteados con el objetivo de proponer una representación formal de los mismos
en un lexicón computacional para el tratamiento del castellano. De forma más
específica, trataré en primer lugar del conocimiento meronímico, y a
continuación de la individuación mediante sintagmas partitivos y del fenómeno
relacionado del polimorfismo referencial, aspecto este último para el cual me
basaré en el trabajo desarrollado por Jackendoff (1991) sobre formalización
del sustrato conceptual que desde su punto de vista subyace al conocimiento léxico. Esquema del
trabajo Tras un primer
capítulo destinado a cuestiones preliminares (Cap. 1) presentaré
las distintas aproximaciones al fenómeno parte-todo (Cap. 2) y los
modelos computacionales de representación del conocimiento que son relevantes
para el presente trabajo (Cap. 3). En el siguiente capítulo (Cap. 4)
formularé mi propio análisis, para pasar a continuación a examinar con más
detalle el problema de las relaciones parte-todo expresadas mediante
construcciones partitivas (Cap. 5). En Cap. 6 describiré el marco
de representación del conocimiento léxico, basado en Pustejovsky (1995),
dentro del cual desarrollaré (en Cap. 6.2) la formalización de diversos
modos de individuación sintagmática del conocimiento parte-todo, mostrando sus
implicaciones para el tratamiento de la semántica compositiva de la oración.
Para un adecuado tratamiento de los sintagmas partitivos y también de otros
aspectos del fenómeno, como la pluralización o la alternancia léxica
sustancia-entidad, presentaré en Cap. 7 un modelo de representación del
polimorfismo referencial. Para finalizar expondré las conclusiones del trabajo
y las líneas futuras de investigación. 1. Marco general y cuestiones
preliminares La lingüística
computacional trata de la formalización o codificación del lenguaje natural en
un lenguaje formal, tratable por medios informáticos con fines aplicados
diversos, tales como traducción automática, acceso a bases de datos, extracción
de información de textos o comunicación con sistemas informáticos -es decir,
con lenguajes formales- mediante el lenguaje natural. En la última década,
gran parte de la investigación en lingüística computacional se ha centrado en
la semántica léxica, a partir de la constatación de que una parte muy
considerable de la información lingüística reside, o puede ser explicada, a
partir de la información contenida en las entradas léxicas. Coexisten en este
momento diversos tipos de aproximación a la lexicografía computacional, cada
uno de ellos con diversos grados de compromiso con respecto a formulaciones teóricas
del campo de la lingüística, la psicolingüística, la filosofía del lenguaje
o la ciencia cognitiva. Aunque en último término la lingüística
computacional, no depende de forma inexcusable del seguimiento de una u otra
teoría lingüística o cognitiva, resulta obvio señalar que, con carácter
previo a la formulación de cualquier tipo de representación computacional del
lenguaje, es preciso haber tomado antes cierto tipo de decisiones previas acerca
de cómo se va a abordar el lenguaje natural y qué aspectos del mismo se
considera preciso representar. Para los propósitos
finales de este trabajo -la formulación de representaciones lingüísticas
tratables computacionalmente- entenderemos en principio la lingüística, en un
sentido ciertamente amplio, como la descripción de una lengua; y de forma más
específica, como la construcción un modelo de las regularidades que, a juicio
del lingüista, se manifiestan en el uso de una lengua. Ello implica asumir la
idealización estructuralista del lenguaje como sistema ontológicamente
exterior a los hablantes (aunque por supuesto conocido, compartido y usado por
ellos con objetivos semióticos varios). Asimismo, el objeto de la descripción,
'la lengua', se entenderá como 'una lengua' en particular, en este caso el
castellano. Cabe resaltar que ambas asunciones son de tipo metodológico; por
consiguiente no entraré aquí en disquisiciones sobre la entidad real del
lenguaje bien como sistema, bien como capacidad mental (competencia), o sobre
las presuntas cualidades de universalidad o innatismo que puedan atribuírsele. Sin embargo,
estas consideraciones no deben ser entendidas como un modo de desentenderse de
la teoría. Por el contrario, los modelos de representación del conocimiento
son en gran medida deudores de modelos o ideas provinentes de los campos de la
psicolingüística y la ciencia cognitiva; existiendo un notable consenso en la
comunidad investigadora respecto a que los modelos computacionales del lenguaje
deben ser, en la medida de lo posible, un reflejo de los modelos mentales.
Siendo el lenguaje una facultad cognitiva humana, es de esperar que un modelo
formal del lenguaje resultará tanto más acertado en cuanto mejor modelo sea de
dichas facultades cognitivas. Éste es también mi convencimiento. Como podrá
comprobarse en lo sucesivo, las representaciones computacionales que formularé
a lo largo de este trabajo estarán basadas en ideas provinentes de la psicolingüística
y la ciencia cognitiva; en especial en el modelo relacional de la memoria léxica,
en la gramática cognitiva, y en las hipótesis semántico-conceptuales de
Jackendoff. Por otra parte,
formular algún tipo de análisis o representación del léxico de una lengua,
implica, por una parte, utilizar una terminología metalingüística para
manejarse en dicho terreno; y por otra, pretender que de algún modo se está
representando o aludiendo a algo de tan difícil definición como es 'el
significado' de las palabras. Como es sabido, la elucidación de qué es o qué
puede entenderse exactamente por significado así como, de forma inseparable, la
definición de términos tales como 'significado', 'sentido', 'referencia',
'denotación', 'designación', etc., es una materia que ha ocupado y sigue
ocupando a filósofos y lingüistas como mínimo desde la Grecia clásica. No
puedo pretender terciar en tan arduo debate, sino tan sólo situarme mínimamente
en dicho marco a fin de utilizar una terminología metalingüística lo menos
gratuita posible. Para ello describiré en primer lugar de modo necesaria y
deliberadamente esquemático los modelos fundamentales o tendencias mayoritarias
a partir de las cuales se han desarrollado la mayor parte de formalismos de
representación del significado. Básicamente,
existen dos tipos de aproximación a lo que pueda significar el 'significado' de
una expresión de un lenguaje: una (habitualmente denominada 'realista') que
parte de Aristóteles, y otra (a la que podríamos llamar 'abstraccionista') que
emerge de la obra de Platón. Ambas
aproximaciones comparten la muy sensata asunción de que existe la realidad, es
decir, el mundo nuestro de cada día, con sus gatos, sus alfombras, sus árboles,
sus sillas y sus taburetes; y también la constatación de que la organización
de dicho mundo en entidades individualmente designables no es en absoluto un
asunto trivial (son famosas en semántica lingüística las discusiones sobre qué
es una silla y qué un taburete; tampoco es fácil decir si una mecedora o una
silla eléctrica deben ser contadas como sillas; o si cada árbol viene
determinado por la existencia de un tronco, o quizá por la existencia de un
conjunto común de raíces, bajo tierra o a una distancia prudencial
-¿cuál?- sobre el nivel del suelo). Sin embargo, una y otra difieren
en que mantienen posturas radicalmente diferentes sobre si un lenguaje (el
lenguaje natural o cualquier otro) puede o no (y si puede, cómo) describir el
mundo, o 'referirse' a él. La aproximación
realista mantiene que las unidades del lenguaje refieren directamente a
entidades del mundo (ver fig. I.1). Los desarrollos basados en la misma
utilizan para tal propósito la herramienta formal denominada 'conjuntos': dado
un universo (que por otra parte puede ser el mundo físico, un mundo abstracto,
o cualquier mezcla de ambos), las entidades en él vienen de un modo u
otro individualizadas, y estas individualidades se agrupan de forma natural
en clases, definibles mediante condiciones necesarias y suficientes, y por tanto
formalizables mediante conjuntos. En los modelos derivados de la aproximación
realista no importa demasiado saber cómo se produce la individuación, de hecho
puede producirse de infinitos modos: lo relevante es que cada modo de
individuación corresponde a posibles conjuntos. Así, puede haber un conjunto
que contenga todo tipo de sillas, sillas eléctricas incluídas, otro que no
incluya sillas eléctricas pero sí tronos y mecedoras, y un tercero que incluya
sillas, sofás, serpientes venenosas y personajes de "El Quijote". Por contra, desde
un punto de vista platónico o abstraccionista, se considera que un lenguaje no
puede referir al mundo, sino únicamente a un universo consistente en
abstracciones u objetos de orden matemático, cuya naturaleza ontológica es
completamente disjunta de la de las colecciones de objetos del mundo real (ver fig.
I.2). Ambos modos de
comprender la significación de un lenguaje son formalizables, y de hecho han
sido formalizados, mediante una semántica teórica de modelos, es decir, un
sistema consistente en (i) un lenguaje o formalismo que disponga, entre otros
recursos, de nombres (propios) para individualidades y nombres (comunes) para
conjuntos de ellas; (ii) un universo (o múltiples universos posibles) que
conste de individualidades de referencia; y (iii), un conjunto de valores de
verdad (Verdadero y Falso) que relaciona uno con otro. En todo caso, la
diferencia fundamental entre las aproximaciones realista y abstraccionista es
que en la segunda, al contrario de lo que sucede con la primera, el universo del
discurso no puede en ningún caso entenderse como el mundo. Por tanto,
dicha aproximación introduce la noción de un tercer nivel de representación
semántica: un nivel abstracto distinto de los niveles del lenguaje y del mundo
de referencia. Desde este punto de vista, que ha dado origen a la mayoría de
los modelos semióticos y lingüístico-semánticos que hoy nos son familiares,
el lenguaje (A) puede describir el mundo (C), pero debe hacerlo a través de la
mediación del nivel abstracto intermedio (B). Por contra, desde el punto de
vista realista, A y B son básicamente la misma cosa: los signos de A no son
sino nombres para las categorías de B. Los principales
herederos de la concepción platónica del significado son el modelo de Frege
(1892) y el de Ogden y Richards (1923). En este último -en el que ya se
entiende abiertamente 'lenguaje' como 'lenguaje natural'- los tres niveles son
los denominados (A) Símbolo, (B) Pensamiento y (C) Referente (ver fig. I.3),
los cuales, según Hayes (1994), deben ser entendidos como A:Lenguaje,
B:Significado, C:Mundo. La noción subyacente, sin embargo, no es en absoluto
novedosa, dado que puede ser hallada anteriormente (cf. Serrano, 1983) en los
estoicos (que diferencian "aquello que es significado", "aquello
que lo significa" y el "objeto"), en San Agustín (quien en 'De
Dochtrina Cristiana' asimismo plantea una distinción entre signo, significado y
cosa) y en los escolásticos medievales (cf. Ullmann, 1962), que acuñaron la máxima
"vox significat mediantibus conceptibus" (la palabra significa
mediante los conceptos). Este tipo de
modelos suele ser representado gráficamente de modo más habitual mediante un
triángulo como en la fig. I.4, en el que, dependiendo de cada aproximación
en particular, cada nivel (especialmente el nivel abstracto, B) y cada relación
entre niveles goza de distinta naturaleza ontológica, recibe distinto tipo de
contenido y, en definitiva, es denominado de forma diferente. En todo caso, se
asume que el nivel B es, aparte de un nivel abstracto, algún tipo de estructura
o representación mental, llámesele 'pensamiento', 'idea', 'significado' o
'concepto'. En cuanto a las relaciones que ponen en correspondencia a los
niveles de representación, Ogden y Richards las denominan de la siguiente
forma: un símbolo 'simboliza' un pensamiento (r1); un pensamiento 'refiere' a
un referente (r2); y un símbolo 'representa' a un referente (r3). El diagrama de la
fig. I.4, sin embargo, no contempla la posibilidad de que, permaneciendo
un referente inalterado, el significado de un nombre pueda cambiar para el
hablante, sea por causa de alguna alteración en la percepción, en el
conocimiento o en el sentimiento hacia el mismo. Frege (1892) sí
había abordado el problema, estableciendo la distinción del contenido
significativo entre 'referencia' -bedeutung- y 'sentido' -sinn-,
según la cual dos signos (p.e. 'el lucero del alba' y 'la estrella de la
noche') pueden tener un mismo referente (el planeta Venus), pero diferente
'sentido'; e incluso un signo (p.e. 'el cuerpo celeste más alejado de la
tierra') puede tener sentido pero es dudoso que tenga referencia. En la terminología
de Frege, un 'signo' expresa un 'sentido'; un 'sentido' designa una
'referencia'; y un 'signo' tiene una 'referencia' -ver fig. I.5-. Es preciso hacer
notar dos aspectos que diferencian al modelo fregeano de los modelos mentalistas
al estilo del de Ogden y Richards. En primer lugar,
adviértase que para Frege, el 'sentido' no es la representación que se pueda
formar en la mente: la representación mental es un objeto individual y
subjetivo, mientras que el 'sentido' fregeano es un ente objetivo, propiedad común
de muchos y susceptible de ser transmitido de generación en generación. En
consecuencia, no debe confundirse el nivel B de Odgen y Richards -de orden
mental- con el nivel B de Frege, el 'sentido' -de orden estrictamente
abstracto-. En segundo lugar,
debe hacerse notar que para Frege, el nivel de los referentes no es el mundo
real, sino el mundo de los conceptos (en los que, en su terminología,
'caen' los objetos o extensiones del mundo real, pero que no son objetos
del mundo real). Por consiguiente, el triángulo signo-sentido-referente -o en
su equivalente para expresiones: expresión-sentido-concepto- de la semántica
de Frege, no es análogo al triángulo de Ogden y Richards (fig. I.4) ni
al genérico de los modelos platónicos (fig. I.2), dado que en Frege el
mundo real de nuestras cosas cotidianas no juega papel directo alguno (únicamente
el papel indirecto de 'caer' en clases de referentes). Por contra, el nivel B (o
'sentido') de Frege debe ser interpretado como un nuevo nivel interpuesto entre
los niveles A y B de los modelos filoplatónicos, correspondiendo el nivel C de
Frege ('referentes'/'conceptos') al nivel B de estos últimos (ver fig. I.6). Finalmente,
apuntemos que el modelo semántico fregeano también es representable, por
supuesto y por antonomasia, mediante una semántica teórica de modelos. Otra manera de
enfocar el asunto, la cual parece representar la primera gran alternativa a los
modelos platónico y aristotélico, es la que emerge de los trabajos de Putnam
(1981) en filosofía, Rosch (p.e., 1973) en psicología cognitiva, Langacker
(1991) en lingüística, y otros en diversos campos, y se compendia y extiende
en Lakoff (1987): la aproximación 'constructivista' o 'cognitivista'. El punto
básico de dicha aproximación es la negación de la validez como teorías semánticas
de los modelos basados en aparatos lógico-simbólicos (conjuntos, condiciones
de verdad, etc.) en tanto en cuanto "el significado no puede ser
caracterizado por la manera en que unos símbolos son asociados a cosas en el
mundo" (Lakoff, op.cit.). El cognitivismo desplaza del centro del
debate semántico a los formalismos y sitúa en su lugar al hombre y a sus
capacidades (cognitivas) de comprensión o 'construcción' de la realidad
externa. Una visión
prejuzgadora del cognitivismo, como la propia de Hayes (1994), considerará la
aproximación como confusa y en definitiva poco científica en tanto la entiende
como poco menos que la asunción de una incapacidad para referirse al mundo
real; y podrá emparentarla, peyorativamente, con la idea de Whorf (1956) de que
el mundo exterior, sin el lenguaje, no es mas que un caos inefable. Una visión
filosóficamente favorable, por contra, la emparentará con el más prestigiado
Wittgenstein (p.e., 1953) en el sentido de que no debe abordarse el problema de
la significación como un terreno en el que las palabras sean las protagonistas
exclusivas en tanto que objetos autónomos contenedores de significado. El cognitivismo
reclama la influencia de Wittgenstein en varios aspectos, y no rechaza de plano
la de Whorf (y Sapir); pero lo que en ningún caso debe entenderse acerca de
esta aproximación es que (como parece entender Hayes) niegue la existencia o la
posibilidad de acceso a una realidad objetiva. El cognitivismo simplemente dice
que no puede existir una descripción objetivamente correcta de la realidad,
sino que existen múltiples maneras de describirla o comprenderla, y en todo
caso éstas son fruto de una construcción (mental, y más o menos antropocéntrica)
que hacen los hablantes de la propia experiencia. El modelo
cognitivista puede ser representado esquemáticamente del mismo modo que el de
Ogden y Richards (1923) (ver fig. I.4) ya que también en éste se
postula la existencia de objetos mentales que median entre el lenguaje y el
mundo externo. La diferencia fundamental radica en la naturaleza de los mismos.
En primer lugar, para el cognitivismo dichas estructuras no son estrictamente
lingüísticas sino que forman parte de los sistemas cognitivos generales y, de
manera decisiva, no se consideran objetos con referencia en entidades del mundo
real (u otros mundos posibles) sino modos de aprehenderlo y construirlo
en la mente. Por otra parte, las clases mentales en que se organiza dicho
conocimiento no pueden ser vistas como conjuntos de elementos sino como categorías
difusas definibles a partir de prototipos (ejemplares centrales o idóneos) o
esquemas estereotípicos. En otro orden de
cosas, se considera que dicho sistema de representaciones mentales es, como en
el caso del 'sentido' de Frege, algo compartido por los hablantes de un mismo
sistema cultural (típicamente con reflejo en un mismo sistema lingüístico);
y, como en los modelos de inspiración platónica, la relación de significación
básica se establece entre el nivel lingüístico (A) y dicho nivel abstracto
(B). El modelo
cognitivista, por definición, no es representable, mediante una teoría semántica
de modelos. Los modos básicos
de entender la significación que hasta aquí hemos esbozado (el realista o
aristotélico, el platónico-fregeano, y la alternativa constructivista a los
dos anteriores) son filosóficamente irreconciliables. Sin embargo, ello no debe
sumir en el desconcierto al lingüista computacional de modo que su trabajo
quede bloqueado a la espera de la resolución de tales problemas filosóficos.
La función del procesamiento computacional del lenguaje es la resolución de
problemas observables en el comportamiento del nivel A (el lenguaje); lo cual es
realizable utilizando un sistema de representaciones formales que, en principio
y como marco de trabajo, puede ser independiente de modelos epistemológicos. En los modelos
computacionales del significado habitualmente utilizados, como los que se
manejarán en este trabajo, se asocia a los signos lingüísticos información
codificada mediante representaciones formales tomadas de un metalenguaje y
ancladas en algún nivel a entidades de un universo ontológico de referencia
formado por símbolos denominados tipos. En este orden de cosas las
representaciones de los signos lingüísticos pueden ser tomadas como los signos
(nivel A de los diferentes modelos semánticos) y la ontología de referencia
como un modelo del mundo extralingüístico (cuyo status comentaremos a
continuación, pero que es asimilable en términos generales al nivel C de Frege
en tanto que, por su propia naturaleza, no puede ser una representación
objetiva del mundo, sino un modelo interpretado del mismo). En un sistema de
representación computacional, el haz de información semántica asociada a cada
signo lingüístico puede se tomado como el nivel B, interpuesto entre los
signos y el universo de referencia. No es necesario a efectos de representación
mantener una postura beligerante sobre la naturaleza epistemológica de dicha
representación semántica. Basta con asumir simplemente que se trata de un
nivel intermedio entre los significantes lingüísticos y el mundo extralingüístico,
necesario a efectos explicativos. A grandes rasgos puede ser considerado como el
significado en un sentido vagamente saussuriano, pero un realista podrá
tratar dicha representación en términos de conjuntos (y definirlos por extensión
o intensión); un platónico podrá verla como una abstracción o concepto; un
fregeano como el 'sentido'; y un cognitivista como un modelo cognitivo. Desde este punto
de vista, las representaciones computacionales del lenguaje pueden ser
interpretadas, mediante el esquema triangular habitual, como en la fig. I.7. Con el fin de
fijar la terminología que utilizaré en el resto del trabajo -en definitiva éste
es el objetivo fundamental de este capítulo- es preciso considerar con mayor
detalle el papel del nivel C o mundo del que son modelo las ontologías
de tipos en los sistemas computacionales. Asumiremos en primer lugar que, como
indica el sentido común, existe el llamado mundo real, o nivel de las
entidades directamente aprehensibles a través de los sentidos y de los hechos o
situaciones en que dichas entidades se ven inmersas. Asumiremos asimismo que es
posible utilizar el lenguaje para aludir al mundo y así comunicarse o
interaccionar con otros hablantes. A la relación que se establece en el proceso
comunicativo entre las expresiones del lenguaje y las entidades o hechos del
mundo le denominaremos referencia. Así, diremos que las expresiones
'Micifuz', 'aquel gato' o 'el gato de mi padre' refieren a una misma cierta
entidad del mundo real. La adopción del
término 'referencia' para indicar esta relación es, aparte de habitual, de
clara estirpe fregeana; y es preciso recordar al respecto que en puridad los
referentes de Frege no son objetos del mundo, sino a los conceptos bajo los
que caen dichos objetos. En otras palabras, el nivel C de Frege no es el
mundo real sino una clasificación del mismo. Lo mismo ocurre con el universo
ontológico de referencia en los modelos computacionales: por tratarse de un
modelo no puede ser sino una clasificación, en definitiva una interpretación,
del mundo extralingüístico. Indudablemente,
por múltiples motivos antes apuntados y ampliamente discutidos desde Aristóteles
hasta nuestros días, la anterior asunción, con parecer razonable, es
claramente insuficiente, ya que evidentemente no toda expresión lingüística
tiene un correlato evidente en el llamado mundo real. Hasta este momento no
hemos hablado de unicornios, y eso debe reputarse como un defecto grave para
cualquier aproximación a la semántica, por generalizante que, como ésta, sea.
Es evidente que, aunque en el mundo real no existen unicornios (ni los
personajes de El Quijote; ni pueda demostrarse que existan los protones o la
justicia; ni esté ni mucho menos clara la existencia objetiva del mes de
septiembre), los humanos -especialmente los lógicos- hablan de unicornios (y
también de Sancho Panza, de protones, de la justicia y del mes de septiembre). Lo más sensato
al respecto es suponer que tal tipo de cosas, si no son del mundo (C), deben ser
de B. Sin embargo habíamos reservado B para conjuntos, significados,
intensiones, conceptos, o categorizaciones de entidades, no para entidades en
particular; y nadie puede impedir que a alguien le apetezca hablar de
('referirse a') el unicornio de Ctesias, el cual dicen fue visto hacia el año
400 a.d.C. Dicho ejemplar de unicornio, por poco probable que sea su existencia,
debe considerarse como perteneciente a la más general clase de los unicornios.
Luego la expresión 'el unicornio de Ctesias', aparte de manejar el concepto
[unicornio], implica algún tipo de referencia a un unicornio en particular.
Pero referencia, ¿dónde? La solución de
compromiso la hallaremos acogiéndonos a la muy veterana noción lógica de los
mundos posibles. Asumiremos que los unicornios son entidades de C, un C que
ciertamente no es el mundo de las cosas tangibles nuestras de cada día, pero
que a efectos comunicativos funciona como si lo fuera. En privado admitiremos
que el C de los unicornios no es más que una ficción, una construcción de la
mente, pero desde el momento en que dicha ficción es (o puede llegar a ser)
compartida por hablantes distintos -en caso contrario no podría existir la
comunicación y el lenguaje perdería la función que hace que nos ocupemos de
él-, asumiremos que los hablantes están de acuerdo en que una palabra como
'unicornio' tiene referencia en un universo (C) sobre el cual se puede hablar. Tal asunción
coincide básicamente con la noción de 'espacio mental' (Fauconnier, 1994),
constructo teórico que sirve de marco para la fijación de la referencia en
gramática cognitiva. Desde esta óptica, por ejemplo, 'Sancho Panza' se tomará
como una expresión con referencia en el universo o 'espacio mental' que
conocemos como 'El Quijote'. A tal respecto,
es digna de ser tomada en consideración la idea de que dichos 'espacios
mentales' o 'mundos posibles' están construidos en la mente de los hablantes a
imagen y semejanza del mundo real, de forma que la maquinaria fundamental de
referencia al mundo real es aplicable a la de los mundos posibles. Un ejemplo muy
ilustrativo de cómo conceptos y entidades no reales se construyen a partir de
conceptos y entidades realmente perceptibles podemos hallarlo en el mundo
literario de Lovecraft. Como es sabido, las criaturas de Lovecraft son de índole
considerablemente mucho más alejada de cualquier referente real que, por
ejemplo, los personajes de El Quijote; sin embargo, tal universo literario, pese
a su extrema extravagancia, es transmitido al lector de forma que éste puede
compartirlo (y éste a su vez referirse a él en conversación con otras
personas, por ejemplo, pero no necesariamente, con otros lectores de Lovecraft);
luego tal universo de referencia es susceptible de funcionar, en la comunicación
lingüística, del mismo modo que el mundo real. ¿Cómo se consigue
ello? Como podremos comprobar en el párrafo siguiente (descripción de un
monstruo, extraída de 'El horror de Dunwich'), no de otro modo que por el
recurso constante a la analogía con conceptos con referencia en la realidad:
Es mayor que
un establo... todo hecho de cuerdas retorcidas... tiene una forma parecida a
un huevo de gallina, pero enorme, con docenas de patas... como grandes
toneles medio cerrados que se echan a rodar... no se ve que tenga nada sólido...
es de una sustancia gelatinosa y está hecho de cuerdas sueltas y
retorcidas, como si las hubieran pegado... tiene infinidad de enormes ojos
saltones... diez o veinte bocas o trompas que le salen por todos los lados,
grandes como tubos de chimenea, y no paran de moverse, abriéndose y cerrándose
continuamente... todas grises, con una especie de anillos azules o
violetas... !Dios del cielo! !y ese rostro semihumano encima...!
LOVECRAFT, H.P. (1925) El horror de Dunwich [tr. esp. en Alianza
Editorial. Madrid, 1993]. En todo caso, una
representación computacional del léxico de una lengua debe aspirar a
representar todo tipo de léxico, tanto el que se entiende como con posible
referencia en el mundo real como el que designa cualquier otro tipo de entidad
imaginaria o imaginable. Para ello, el modo de proceder sin quedarse atorado en
disquisiciones filosóficas pasa por asumir que el universo de referencia en las
representaciones computacionales (nivel C en la fig. I.7) incluye no únicamente
a las entidades con existencia real sino también a aquéllas con existencia
en cualquier otro mundo expresable mediante el lenguaje. En un sistema de
representación basado en estructuras de rasgos como el que utilizaré, los
rasgos utilizados para la descripción han sido definidos previamente, como se
ha dicho, en una ontología de tipos, que se asume como un modelo -más o
menos acertado, y sin duda, como mínimo, incompleto- de las clases de entidades
que conforman el conocimiento compartido por los hablantes de una lengua. En
consecuencia, por ejemplo, en dicho formalismo se podrá expresar sin mayores
remordimientos filosóficos que Sancho Panza tiene brazos, cabeza y piernas; y
que un unicornio es como un caballo pero con un cuerno en la frente; siendo
suficiente que [brazo], [pierna], [caballo], [cuerno], [unicornio] o [Sancho
Panza], sean tipos definidos en la ontología; y sin que tenga mayor relevancia
el que tales conceptos sean susceptibles de tener referencia en el mundo real,
en un espacio mental de Fauconnier, o en alguna otra especie de mundo
posible. Como corolario, también dicho universo de referencia podrá
(probablemente deberá) contener los objetos del metalenguaje utilizado en las
representaciones. Veamos un ejemplo
de dicho panorama en la fig. I.8, en donde una representación parcial de
un sistema de tipos (nivel C) contiene el universo general que es modelo del
mundo de referencia, incluídos objetos imaginarios -como los unicornios- y
abstractos -como los objetos del metalenguaje, incluidos los signos lingüísticos
(nivel A) y las representaciones semánticas a ellos asociados (nivel B)-. Por supuesto debe
constatarse que la categorización o clasificación de entidades no es un asunto
que esté en absoluto claro; es más, es probable que no sea objetivamente
decidible; pero, una vez más, confiaremos en que existe algún tipo de convenio
implícito o convención al respecto que los hablantes de una lengua conocen y
comparten; y en definitiva, las representaciones lingüístico-computacionales del
mundo de referencia simplemente aspiran a ser un modelo de dicho
conocimiento compartido que sea utilizable para un cierto número de
aplicaciones de ingeniería del lenguaje. Sentado todo lo
anterior, fijemos por fin los términos que en lo subsiguiente voy a emplear
para referirme a los objetos de B y sus relaciones con A y C. Habrá que hacer
al respecto una nueva precisión. Hasta ahora hemos venido hablando de forma genérica
de los niveles A (lenguaje, signos, palabras), B (conceptos, significados) y C
(mundo). Sin embargo es preciso distinguir entre la semántica léxica y la semántica
de las expresiones en el discurso. La segunda se fundamenta en la primera. En el
primer caso la intención es caracterizar objetos abstractos, informalmente,
'palabras' (como por ejemplo 'gato'), que pueden tomar diversas formas (por
ejemplo, 'gatos'), que se suelen nombrar mediante una de sus formas, llamada
'lema' (por convención, en castellano, para nombres es la forma singular, para
verbos la infinitiva, para adjetivos la masculina singular), y que son
susceptibles de ser utilizadas bajo alguna de sus formas en las expresiones lingüísticas
(como por ejemplo en 'el gato de mi padre'). Es preciso pues distinguir entre
dos triángulos A-B-C, el lexicológico y el de las expresiones.
· En
el modelo de las expresiones (ver fig. I.9), siguiendo, como se
ha dicho antes, de forma laxa a Frege, llamaremos a los elementos del nivel
A, expresiones (p.e. 'el gato'); y a sus correspondencias en el mundo
(nivel C), referentes. A las correspondencias de las expresiones de A
en el nivel B las llamaremos conceptos o significado de A. No
creo que sea precisa una denominación especial para la relación de
correspondencia entre significados (B) y referentes (C), pero en todo caso
si hay que mencionarla será también como una relación de referencia
(desprendiéndose del contexto que se trata de una vía indirecta de
referencia). En cuanto a convenciones de notación, en lo subsiguiente
utilizaré la forma entre comas simples para el nivel A, una expresión
entre corchetes para el B, y ninguna notación en particular para el nivel
C. Así, diremos que la expresión 'el gato de mi padre' significa [el gato
de mi padre]; y que 'el gato de mi padre' se refiere al gato de mi padre. · En
el triángulo léxico-semántico (ver fig. I.10), denominaremos a
los elementos de A (abstracciones de las formas posibles de las palabras,
unidades de significado léxico) lexemas, siguiendo la tradición filológica
habitual. A su relación con los elementos de B (conceptos o significados)
la denominaremos, siguiendo a Lyons (1977), denotación. Aunque quizá
de forma estricta no quepa considerar que exista relación entre los lexemas y
los referentes o entidades del mundo (C), diremos que los
lexemas refieren potencialmente a las entidades de C. Así, diremos que
el lexema 'gato' (A), denota el concepto o categoría [gato] (B) y tiene la
capacidad de referir en el contexto de una expresión a los gatos que en el
mundo hayan (C). Con estas
precisiones y la esperanza de que el contexto desambigue cualquier otro modo
menos laxo de hablar (como por ejemplo llamar 'palabras' a los 'lexemas'), creo
que podemos pasar a tratar del lenguaje, el mundo, los conceptos, y de sus
representaciones computacionales. 2. Aproximaciones al
conocimiento parte-todo 2.1 Enfoques
léxico-relacionales: la meronimia En este capítulo
presentaré las aproximaciones teóricas que han tratado, desde diversos puntos
de vista, el tema del conocimiento parte-todo relativo a entidades -por tanto
codificado en el lenguaje mediante nombres-. Dichas aproximaciones pueden
dividirse en dos clases principales: léxico-relacionales y constructivistas. Las
aproximaciones del primer tipo son de orden exclusivamente lexicológico, luego
no toman en consideración el modo sintagmático de individuación en el
lenguaje. En dicho marco se asume que el significado léxico viene determinado
por las relaciones que cada unidad establece con el resto del lexicón, tomado
en su conjunto como una gran red semántica. Se trata pues, de aproximaciones de
clara raigambre estructuralista, con diferentes matices. Por una parte, los análisis
de Lyons y Cruse son de orden lingüístico-descriptivo, evitándose la toma de
compromisos teóricos acerca de la posible realidad mental de las unidades léxicas
y de las relaciones que entre ellas se establecen. En su trabajo el análisis
semántico se fundamenta de forma exclusiva en juicios de normalidad o
anormalidad respecto a la aparición de las unidades léxicas en diversos
contextos lingüísticos. Por contra, los investigadores situados en el marco de
la psicolingüística (Miller y Johnson-Laird; Winston, Chaffin y sus colegas)
postulan la existencia real en la mente de una estructuración relacional del
conocimiento léxico-semántico. En ambos casos, la relación parte-todo, o de meronimia,
es considerada como uno de los tipos fundamentales de estructuración del
lexicón, el cual se superpone a la relación taxonómica (o de hiponimia) y es
en cierto modo transversal con respecto a ésta (ver fig. II.1). El autor
que trata de forma más extensa y precisa las relaciones de parte desde un punto
de vista estrictamente lingüístico es Cruse (1986), partiendo de las
consideraciones previas de Lyons (1977). La aproximación de Cruse, sin embargo,
no puede desligarse de los modelos psicológicos de la memoria léxica.
Ciertamente, ni Cruse ni previamente Lyons reclaman para sus análisis status
alguno de realidad mental; por contra, se basan únicamente en juicios de
aceptabilidad lingüística de las palabras en contexto. Pero no debe pasar
desapercibido el hecho de que el análisis de la meronimia de Cruse recoge los
realizados en el campo de la psicolingüística anteriormente por Chaffin y
Herrmann (1984), y simultáneamente por Winston et al. (1987); mientras
este último, a su vez, se apoya ampliamente en el de análisis lingüístico de
Cruse. Como tampoco que la aproximación de Winston et al. se enmarca en
el modelo de la memoria léxica desarrollado por Miller y Johnson-Laird (1976);
mientras que, ya en el campo de la representación computacional, WordNet, una
base de datos que proclama basarse en principios psicolingüísticos
-desarrollada por el equipo del propio Miller (Miller et al., 1990)-,
utiliza para la definición de las relaciones léxicas, entre otros, los análisis
lingüísticos de Cruse. Finalmente, una base de datos léxico-relacional que no
prentende ser un modelo psicolingüístico sino puramente lingüístico,
EuroWordNet, se fundamenta tanto en el trabajo lingüístico de Lyons y Cruse
como en el piscolingüístico de Miller y Winston et al. (cf. Alonge et
al., 1996; Climent et al., 1996). Como puede verse,
en el campo de la semántica léxico-relacional, los modelos puramente lingüísticos
y los psicolingüísticos se entrecruzan e incluso se solapan, nutriéndose los
unos de los otros hasta formar, prácticamente, un cuerpo teórico único. Esta
situación no debe resultarnos extraña, sino que por el contrario resulta
habitual en lingüística. El lenguaje es una manifestación privilegiada de las
facultades cognitivas del hombre; quizá, incluso, una de dichas facultades
cognitivas; pero en todo caso, lenguaje y cognición humana son realidades
inseparables. Por ello, no debe resultar en modo alguno insólito que
descripciones lingüísticas y modelos psicolingüísticos guarden paralelismos
e interaccionen entre sí. Los dos modelos
principales de organización de la memoria léxico-conceptual son, según
Saint-Dizier y Viegas (1995), el de Collins y Quillian (1972) y el antes citado
de Miller y Johnson-Laird (1976). En la representación de Collins y Quillian la
memoria léxica se estructura en forma de grafo, es decir, de nodos (conceptos)
conectados por relaciones binarias de tipo lógico o asociativo ('y', 'o', ...).
Dicha estructura se basa en el principio de economía organizativa, no
previendo, pues, la existencia de redundancias en cuanto a conexiones y
almacenamiento de la información, por lo que dicho modelo se ha visto
invalidado a la luz de posteriores avances en el campo de la neurolingüística
(p.e. vid. Damasio y Damasio, 1992) que parecen demostrar que la organización
de la memoria no se rige por el principio de economía sino por el de
eficiencia, con multiplicidad de conexiones y redundancias que permiten un
acceso flexible a la información. El modelo de
Miller y Johnson-Laird es compatible con la redundancia y la diversidad
organizativa (cf. Miller et al., 1990). En su aproximación (ver fig.
II.2) los conceptos son estructuras que median entre esquemas perceptuales,
etiquetas léxicas e información gramatical asociada a estas últimas. Los
esquemas perceptuales incluyen información sobre las características
distintivas de los objetos (forma, color, dimensión, etc.) -extraídas a partir
de la percepción y luego esquematizadas-, información funcional y posiblemente
otros tipos de información mnésica. El significado de los conceptos se deriva
en dicho modelo de las diferentes relaciones (Es-Un, Parte-De, ...) que
establecen con otros conceptos. Las aproximaciones léxico-relacionales que, por
lo que refiere a las relaciones parte-todo, describiré en este capítulo, se
enmarcan dentro de este modelo. Las
aproximaciones que trataré en la segunda parte de este capítulo, y que
denomino constructivistas, difieren de las anteriores en que no se ciñen,
como mínimo no de forma estricta, al estudio del significado en su vertiente
puramente lexicalizada -en el que, de modo más o menos tácito, se toman a las
unidades léxicas como punto de partida del análisis semántico-, sino que
centran su estudio en las categorías mentales que, según se postula, subyacen
al conocimiento lingüístico. En este tipo de aproximaciones no se aborda el
conocimiento parte-todo como una mera relación paradigmática entre unidades léxicas.
Por una parte, la corriente cognitivista considera que dicho conocimiento es uno
de los mecanismos fundamentales que dan lugar a la formación de las categorías
mentales (que ulteriormente serán expresadas mediante unidades lingüísticas).
A partir del trabajo de Rosch (p.e. 1973, 1976) se introduce en los modelos de
memoria léxico-conceptual la noción de prototipo, o ejemplo típicamente
representativo de un concepto o de los rasgos asociados a un concepto. Dicha
aproximación supone un notable cambio de enfoque respecto al tipo de información
que dota de significado a los conceptos, al establecerse relaciones de
proximidad entre éstos y ejemplares prototípicos de las categorías. En ella,
además, los conceptos se construyen a partir de cierto número de rasgos,
siendo un tipo fundamental de ellos, como veremos, los denominados rasgos de
parte. Por otra parte,
Jackendoff postula la existencia de rasgos conceptuales extralingüísticos
susceptibles de dar cuenta de realizaciones lingüísticas en las que se ven
implicados modos ciertamente sutiles de inclusión parte-todo -como la relación
unidad-pluralidad, la relación entre una entidad y sus límites, o la relación
entre una entidad y la sustancia que la conforma-. En el modelo de Jackendoff
(p.e. 1992) no existe un componente léxico propiamente dicho, sino que se
postula que el lexicón se halla distribuido en las reglas de correspondencia
entre módulos mentales, p.e. entre las reglas que relacionan estructuras fonológicas
y estructuras sintácticas; y entre estructuras sintácticas y estructuras
conceptuales (ver Fig. II.3). Siguiendo la línea generativista,
Jackendoff concibe la mente como una estructura modular secuencial, en la que
cada módulo (p.e. fonológico, sintáctico, conceptual) recibe un input
de un módulo previo y genera un output al módulo siguiente. Al igual que el
modelo de Collins y Quillian, la estructura modular de la mente parece haber
sido desmentida por los más recientes descubrimientos en materia de funciones
corticales que, como he apuntado antes, sugieren una estructura en forma de red
distribuida con múltiples interconexiones e interacciones entre todo tipo de
nodos informativos. Sin embargo, el análisis de Jackendoff (1991) relativo a
diversos aspectos de la información parte-todo es, como veremos posteriormente,
susceptible de ofrecer explicación a diversos problemas de tratamiento del
lenguaje, como por ejemplo el que desarrollaré en §7, las
restricciones de selección de los nombres partitivos. A pesar de
las diferencias teóricas entre los diferentes modelos, a efectos de
representación computacional del conocimiento léxico, las nociones de concepto
lexicalizado que manejan todos ellos son igualmente representables en bases de
representación del conocimiento. Resulta hasta cierto punto irrelevante desde
el punto de vista de la formalización que el significado se defina en el modelo
de Miller y Johnson-Laird mediante relaciones, y en el modelo cognitivista
mediante rasgos, dado que, en una base de datos léxica, los rasgos
pueden ser vistos como etiquetas de relación, y las relaciones como nombres
para los rasgos. Tomemos por ejemplo los conceptos lexicalizados 'ave' y
'ala'. En WordNet -formalismo directamente basado en el modelo de Miller y
Johnson-Laird- hallaríamos la representación parcial esquematizada a la
izquierda de Fig. II.4; por otra parte, una representación basada en
rasgos -como la utilizada en LKB (Copestake, 1992), formalismo que describiré y
utilizaré más adelante- tomaría la forma que puede verse a la derecha de la
misma figura. Como puede observarse, salvando divergencias teóricas, desde el
punto de vista de cantidad de información representada y contenido de la misma,
ambas representaciones son perfectamente equivalentes. En cuanto al
modelo de Jackendoff, los elementos explicativos que en el mismo aparecen como
primitivas conceptuales son, a pesar de enmarcarse en un modelo cognitivo
totalmente dispar, igualmente representables en forma de rasgos y/o de nodos de
la ontología de tipos en los formalismos de representación del conocimiento léxico
y, en definitiva, asumibles como parte del conocimiento que comparten los
hablantes. En todo
caso, y a modo de corolario de esta introducción, es preciso hacer notar las
aproximaciones de uno y otro tipo, léxico-relacionales y constructivistas, no
deben ser consideradas como radicalmente disjuntas, sino que tienen diversos
aspectos en común que podrían dar pie a otros modos de estructuración de este
capítulo. El constructivismo y la aproximación psicolingüístico-relacional
comparten la postulación de realidad mental para los constructos teóricos que
se proponen. En particular, tanto el cognitivismo como la psicolingüística,
con diferentes matices, asumen algún tipo de organización del significado léxico
en el cerebro humano en forma de red distribuida multirrelacional. En otro orden
de cosas, por lo que atañe a la posibilidad de formalización del conocimiento
semántico para el procesamiento del lenguaje, tanto la aproximación psicolingüística
como la de Jackendoff comparten una clara orientación en dicho sentido, dado
que postulan la existencia de constructos semánticos -en el primer caso
relaciones, en el segundo rasgos conceptuales- codificables en formalismos de
representación del conocimiento lingüístico. Así pues, pasaré
a continuación a describir en primer lugar en §2.1 las aproximaciones léxico-relacionales
en lo que refieren al conocimiento parte-todo; y en segundo lugar en §2.2
veremos las aproximaciones constructivistas. 2.1.1 Lyons
El primer trabajo relevante al respecto es el de Lyons (1977), quien parte de la concepción saussureana de la lengua como una estructura relacional, en el que las unidades lingüísticas (sonidos, palabras, significados) son tomadas como puntos de un sistema o red de relaciones. En dicho modelo, los constructos postulados para el análisis del lenguaje derivan de su mutua relación con otras unidades del mismo sistema lingüístico. Desde este punto de vista, se considera que una de las relaciones que estructura el léxico es la relación parte-todo. En primer lugar debe constatarse que no ofrece Lyons una definición formal de la relación parte-todo, aunque sí asume que la misma,
El principal objetivo del análisis de Lyons es dilucidar si la relación parte-todo es, como la hiponimia, transitiva; y apunta de entrada que el desacuerdo que dicha cuestión suscita indica de inmediato que
Para el autor debe distinguirse, respecto a la transitividad, entre la que se establece en el vocabulario y la que se establece en el mundo, apreciando que "el hecho de que una entidad pueda describirse como parte de otra no implica, sin embargo, que se establezca una relación parte-todo entre los lexemas del vocabulario que se emplean para aludir a estas entidades." (op.cit.) Su conclusión al respecto es que mientras en el mundo, por lo que refiere a entidades físicamente discretas y a puntos o zonas del espacio-tiempo, tal relación es transitiva (en su ejemplo, si una empuñadura es parte de una puerta y una puerta lo es de una casa, una empuñadura es parte de una casa), en el lenguaje las relaciones parte-todo no necesariamente son transitivas: pueden serlo, pero no todas lo son, lo que deduce de la no aceptabilidad de frases como (1c) a pesar de la aceptabilidad de (1a,b):
(1) a. la empuñadura de la puerta Lyons constata
asimismo que es difícil diferenciar entre meronimia e hiponimia en el caso de
relaciones léxicas en las que se ven implicadas palabras que no sean nombres
cuantificables que denoten objetos discretos, p.e. nombres de masa o sustancia
('oro'), abstractos ('honradez'), o colectivos ('ganado'); o verbos que denotan
actividades ('coser'). Así, 'oro' puede ser visto como un tipo de
'sustancia' o una parte de 'sustancia' ('esta sustancia contiene oro'
frente a 'esta sustancia es oro'); 'honradez' como un tipo o una parte
de 'virtud'; 'hilvanar' como un tipo o una parte (un subevento) de
'coser'; 'vaca' como un tipo o una parte de 'ganado'. Respecto a
éste último caso, hace notar que, por contra, no es posible postular relación
de hiponimia, y sí sólo de meronimia, entre 'oveja' y 'rebaño'. La razón
recaería para Lyons en que los nombres de grupo, como 'rebaño', a diferencia
de los colectivos como 'ganado', tienen una función individualizadora,
similar a la de 'estanque' en relación a 'agua': 'rebaño' individualiza un
conjunto respecto a individuales indiferenciados ('ovejas') de la misma forma
que 'estanque' individualiza una cantidad de una sustancia ('agua'). 2.1.2 El enfoque psicolingüístico. El equipo encabezado por Chaffin y Herrmann desarrolla a partir de las consideraciones de Lyons un marco explicativo de las relaciones meronímicas fundamentado en la experimentación psicolingüística. En dicho marco se trata las relaciones ya no simplemente como un medio para estructurar el léxico de una lengua sino además como entidades con realidad psicológica que constituyen el armazón de la memoria semántica de los hablantes, los cuales incluirían dentro de su competencia lingüística las capacidades de comparar, identificar y producir de forma creativa relaciones semánticas. La aproximación más relevante en dicho marco es la de Winston et al. (1987), que tiene su antecedente en el de Transue (1982), quien clasificó 31 términos que ocurren en el esquema "A es un X de B", agrupándolos en las cinco categorías mayores reflejadas en la tabla II.1. Tomando dicho trabajo en consideración, Winston et al. (1987) desarrollan su propio análisis de las relaciones léxicas parte-todo, llegando a las siguientes conlusiones generales: · la
meronimia no es una relación sencilla sino una familia de relaciones
En cuanto a la transitividad de la inclusión meronímica, los autores postulan la hipótesis de que, existiendo diversos tipos de meronimia, no puede darse la transitividad que implique tipos diferentes. Esta hipótesis da cuenta de las aparentes paradojas señaladas por Lyons (1977) y Cruse (1979) (cf. Iris et al., 1988). Así, la no aceptabilidad de (2c) se explicará por el hecho de que (2a) y (2b) son instancias de diferentes tipos de meronimia (respectivamente, Componente-Objeto y Miembro-Colección). (2) a. El
dedo de Simpson es parte de Simpson Los tipos de
relaciones meronímicas que Winston et al. (1987) postulan son los de la tabla
II.2:
Tabla II.2: Modelo de Winston et al. (1987) Asimismo desarrollan la teoría (Teoría de los Elementos Relacionales) de que cada tipo de meronimia no es en sí una entidad unitaria o primitiva, sino que pueden ser descompuestas -y definidas- a partir de tres elementos de significado de orden más básico, o rasgos semánticos booleanos: ±Funcional, ±Homómero, y ±Separable. Las definiciones que ofrecen para dichos rasgos son las siguientes: · Funcional:
las partes están o no en una posición espacial/temporal específica con
respecto a las demás [partes del todo] , lo que sirve de base a su rol
funcional con respecto al todo La combinación de dicho trío de pares de rasgos (o elementos relacionales) caracteriza cada tipo de meronimia, del siguiente modo: ·
Componente-Objeto +F -H +S Dichas tesis fueron desarrolladas posteriormente por Chaffin y Herrmann (1988), abundando en la idea de que las relaciones son conceptos abstractos compuestos de elementos relacionales, los cuales gozarían de entidad psicológica real -según demostraría la experimentación psicolingüística llevada a cabo por los autores-. Los elementos relacionales dan cuenta para Chaffin y Herrmann de las características de las relaciones meronímicas y de la capacidad del hablante para emitir juicios al respecto: cuántos más elementos compartan dos relaciones, más similares serán éstas entre sí. En un experimento previo (Chaffin y Herrmann, 1984) se ofreció a un grupo de sujetos un listado de 31 relaciones ejemplificadas mediante cinco pares de palabras cada uno, a fin de que las clasificaran de acuerdo con la similitud o disimilitud que juzgaran existían entre ellas. El resultado fue una jerarquía de similitud de relaciones, las cuales resultaron agrupadas en los cinco grupos mayores siguientes: Contrastes ('vivo'-'muerto'), Inclusión de Clase ('animal'-'caballo'), Similares ('coche'-'auto'), Casos ('pintor'-'pintar') y Parte-Todo ('coche'-'motor'). Cada relación se definió mediante rasgos distintivos (tomados del trabajo de Stasio et al., 1985, quién a su vez las extrajo de diversas fuentes bibliográficas de los terrenos de la lingüística y la psicología). Para la familia parte-todo, los rasgos -o elementos relacionales- relevantes son: PR
(Propiedad): Palabra2 es una propiedad de Palabra1 De acuerdo con dichos rasgos se clasificaron las relaciones parte-todo como un subconjunto de siete relaciones (de entre las 31 relaciones semánticas clasificadas), definidas y ejemplificadas del siguiente modo: · Objeto
Funcional (árbol-hoja) PR, PO, A, C En un segundo estudio, la familia de relaciones parte-todo y similares fue afinada y detallada, resultando la clasificación reflejada en la tabla II.3.
Como se ha
apuntado, dicho haz de relaciones se ordenó de forma jerárquica de acuerdo con
la proximidad entre ellas (de acuerdo con la percepción de los sujetos del
experimento). Los resultados más destacables de dicha ordenación son: (a) se
percibe que el mayor grado de diferencia es el existente entre el grupo de
relaciones de Material y el resto de relaciones; (b) de entre el resto de
relaciones (todas excepto Material), el mayor grado de diferencia es
atribuido a la relación Masa-Porción (ver fig. II.5).
Hasta aquí
hemos visto las líneas fundamentales de la aproximación psicolingüística. A
continuación examinaremos la de Cruse (1986), que toma algunos aspectos de la
misma y la extiende a partir de criterios más estrictamente lingüísticos. Cruse (1986), al igual que Lyons, parte del axioma de que el significado de las unidades léxicas se refleja necesariamente en esquemas de comportamiento lingüístico; es decir, en juicios de normalidad o anormalidad aplicados al uso de tipos coherentes de palabras en contextos determinados, los cuales se toman como paradigmas reveladores de las propiedades léxico-semánticas. Por ejemplo, la posible relación de hiponimia entre 'oveja' y 'animal' o 'planta' vendrá determinada canónicamente por la normalidad o anormalidad de su uso en la expresión 'un/a X es un/a Y' ('una oveja es un animal', '*un animal es una oveja', '*una oveja es una planta'). Para Cruse la
meronimia es el segundo tipo principal de jerarquía léxica ramificante -tras
la hiponimia-, y admite la plausibilidad de la hipótesis antropocentrista (ver
más abajo 2.2.1) defendida por Lakoff y la corriente cognitivista, según
la cual una percepción o conciencia primigenia de la estructuración parte-todo
del propio cuerpo sería el detonante de la formación de una organización análoga
del resto de categorías léxico-conceptuales. Relación de parte y relación de porción La distinción básica que hace es, dentro de la relación parte-todo que engloba a ambas, entre relación de parte ('part of') y relación de porción ('piece of'), diferencia que ilustra tomando como ejemplo una máquina de escribir. Con la ayuda de una sierra puede dividirse una máquina de escribir en un número indeterminado de trozos; sin embargo, para obtener sus partes deberá usarse un destornillador. Partes y porciones comparten las siguientes características: estabilidad topológica (no puede hablarse de una parte o una porción de vapor), continuidad espacial (una parte o una porción son entidades continuas), y relación topológica determinada de partes y porciones con sus todos y sus partes o porciones 'hermanas'. Por contra, difieren en las siguientes: · La relación
porción-de es siempre transitiva; la parte-de no siempre lo
es Esta última característica, la funcionalidad, es especialmente importante dado que es capaz de delimitar 'partes' sin que exista discontinuidad con el todo, p.e. 'la punta de la lengua' ('the tip of the tongue') deberá ser considerada 'parte' y no 'porción' en tanto tiene una funcionalidad definida. Asimismo, para
Cruse la relación de porción no cristaliza en niveles léxicos debido a que
las porciones no pueden ser agrupadas en subclases debido a la falta de una
suficiente constancia de atributos. Definir la meronimia. Hasta aquí las consideraciones de Cruse no han sido de tipo lingüístico sino general. A partir de ellas, pasa al terreno estrictamente lingüístico. Una primera definición provisional de meronimia es: "the semantic relation between a lexical item denoting a part and that denoting the corresponding whole" ["la relación semántica entre un lexema que denota una parte y otro que denota el correspondiente todo"] (Cruse, 1986) A partir de ella debemos hacer notar dos cosas: (i) que la
meronimia no incluye la relación de porción, sino únicamente la de parte; La definición formal básica (que deberá ser ulteriormente precisada) de meronimia es, para el autor, la siguiente: X es un merónimo de Y si y sólo si oraciones de la forma "un Y tiene Xs / un Y tiene un X" y "un X es parte de un Y" son normales cuando las frases nominales "un X", "un Y" son interpretadas genéricamente. Así, para que exista meronimia debe poder juzgarse normalidad en ambos supuestos posibles ('un cuerpo tiene brazos' y 'un brazo es parte de un cuerpo'; pero nótese que: 'un hijo tiene una madre' / '*una madre es parte de un hijo'). Hemos dicho que la anterior definición formal es la básica, sin embargo no la definitiva pues no cubre todo tipo de meronimias: por ejemplo, aunque 'sépalo' parece que debe ser considerado merónimo de 'flor', Cruse no juzga normal la oración '?una flor tiene sépalos' (debido a que no todas las flores tienen sépalos). En consecuencia, propone incluir un nuevo 'test' que permita aceptar como meronímica la relación 'sépalo'-'flor' y otras (que trataremos a continuación) que no tienen cabida en la definición básica: las partes de un Y incluyen el X/los Xs, el Z/los Zs, etc. Para
el autor, la existencia de meronimias que no superan el test fundamental
corrobora la tesis ya anteriormente formulada de que existen no una, sino una
multiplicidad de relaciones meronímicas, las cuáles se deben a diversos
factores, que trataremos más adelante. Transitividad de la meronimia Los principios más generales postulados por Cruse respecto a la transitividad de las relaciones parte-todo son: · La relación
'porción de' es inequívocamente transitiva (una porción de una porción
de un todo es una porción del todo, p.e., un trozo de un trozo de pan es un
trozo de pan); sin embargo, en la relación 'parte de' -lingüísticamente,
la meronimia- deben cumplirse ciertas condiciones. En relación con los ejemplos típicos de Lyons (1977) de existencia ('puño'® 'manga'® 'chaqueta') o inexistencia ('empuñadura'® 'puerta'® 'casa') de la transitividad, Cruse atribuye el segundo supuesto a tres tipos de factores. Por una parte, postula que la transitividad no se mantiene en el caso de las 'partes unidas', y sí en el de las 'integrales.' Así, siendo 'dedo' parte unida de 'mano' y 'mano' de 'brazo', será dudoso afirmar que '?un dedo es parte de un brazo'; pero sí podrá decirse que 'una rótula es parte de una pierna' ya que 'rótula' es parte integral de 'rodilla' y 'rodilla' lo es de 'pierna'. En los ejemplos de Lyons (1977), no se producirá la transitividad entre 'empuñadura' y 'casa' y sí entre 'puño' y 'chaqueta' por las mismas razones. Otro factor que determina la no aceptabilidad de 'una empuñadura es parte de una casa' es el de la polisemia lógica (en la terminología de Cruse, la subyacencia de un espectro de sentidos) de 'empuñadura': dado que el término es susceptible de referir a una gama diversa de objetos, aún cuando pudiera concebirse una casa con empuñadura (p.e. en el caso de una casa de juguete), dicho sentido -aunque estrechamente relacionado con el mismo- no sería exactamente el atribuible a 'la empuñadura de una casa'. Finalmente, '*una
empuñadura es parte de una casa' tampoco es aceptable a causa de lo que Cruse
denomina dominio funcional. Considera que las partes tienen típicamente
una función más o menos determinada con respecto al todo; y en el caso que nos
ocupa no es imaginable la función de una 'empuñadura' con respecto a una
'casa' (excepto en el supuesto de una casa de juguete). En cambio 'puño' sí
tiene una función con respecto a 'chaqueta' -la misma que con respecto a
'manga', una función básicamente decorativa-, por lo que sí es aceptable la
expresión 'el puño de una chaqueta'. Diferencias y similitudes entre taxonomías y meronimias. Para el autor ambos tipos de jerarquías léxicas, fundamentalmente y aparte de otras consideraciones marginales, se asemejan en que parecen responder a un mismo principio subyacente de subdivisión, y se diferencian en cómo se relacionan con los hechos extra-lingüísticos, pues las meronimias parecen estar más directamente relacionadas que las taxonomías con la realidad. Ambas, taxonomías y meronimias, implican para Cruse una especie de relación de inclusión por lo que parecen ser manifestaciones alternativas de un mismo principio: la subdivisión. Cada una de ellas daría cuenta de dicho principio atendiendo a un parámetro diferente. La taxonomía lo haría desde el punto de vista de la distintividad externa, es decir, basándose en el grado de similitud o disimilitud entre entidades por causa de atributos compartidos y no compartidos. La meronimia, por su parte, atendería al factor de cohesión interna de las entidades, es decir, a la oposición entre integridad física y desconexión. La consecuencia más directa de la similitud/disimilitud entre una y otra relación es que una taxonomía puede ser descrita como una relación parte-todo, pero no al revés. Por lo que
respecta a las diferencias, para Cruse la fundamental es que 'la taxonomía es
una jerarquía de clases y la meronimia una clase de jerarquías'. La meronimia
trata de la estructuración de las partes (individuales) de cada entidad
(individual), por tanto, como relación, es una clasificación de un haz de
jerarquías (p.e., de todas las relaciones cabeza-cuerpo detectables en el
conjunto de los cuerpos). Advierte sin embargo, que ello no debe hacer
presuponer que la meronimia es puramente un asunto de la realidad, sino que es
primordialmente léxico-semántico (como es de observar a partir de los diversos
fenómenos antes relatados de facultatividad, espectros de sentidos, etc.) ya
que se fundamenta no en la realidad en sí sino en la atribución de etiquetas léxicas
a partes o grupos de atributos de la realidad. Tipos de meronimia: Meronimias Central y Periférica La distinción básica que sienta Cruse es entre el tipo de meronimia que considera central y los tipos periféricos o cuasi-meronímicos. La primera es la relación existente entre partes y todos de entidades físicas cohesionadas y tangibles; la segunda clase incluye relaciones entre nociones tales como colectividades, entidades abstractas, masas, etc. Ambos tipos se abordan por separado y dentro del tipo central se tienen en cuenta dos tipos de factores: en primer lugar factores de interferencia de niveles; y en segundo los diversos tipos de cohesión parte-todo -a fin de seguir la descripción, véase a continuación la tabla II.4-. I. Meronima central: entidades fisicas. Diversos factores diferenciales motivan la existencia de diversos tipos entrelazados de relación meronímica (incluso dentro del propio tipo central). El primer paquete de factores tiene que ver fundamentalmente con el hecho de que las taxonomías meronímicas no muestran una organización clara en niveles coherentes sino diversos grados de interferencia y solapamiento entre ellos. Describiremos en primer lugar dicho haz de factores, y a continuación otros dos relativos el tipo de cohesión existente entre las partes de las entidades. Factores de interferencia de niveles en el tipo central de meronimia. Un grupo de cuatro factores: opcionalidad, congruencia, espectro de sentidos y holo-meronimia, es la causa de que diversas relaciones parte-de no superen, o lo hagan de forma dudosa, los tests de meronimia estricta que sirven de definición de la relación. Los describiré someramente a continuación.
Este criterio contempla el hecho de que una parte lo sea de un todo (o un todo tenga a algo por parte) de forma necesaria, o bien de forma opcional. Así, una flor, opcionalmente -pero no necesariamente- tiene sépalos; y ello es lo que invalida la expresión '?una flor tiene sépalos', pero no 'un sépalo es parte de una flor'. La combinación de las condiciones de opcionalidad y obligatoriedad en cualquiera de los dos sentidos de la relación ('X es merónimo de Y', 'Y es holónimo de X') da lugar a cuatro tipos de meronimia: (a1).- canónica/canónica (p.e. 'brazo'-'mano', pues una mano es necesariamente parte de un brazo y un brazo necesariamente tiene una mano) (a2).- facultativa/facultativa (p.e. 'universidad'-'museo', dado que un museo puede ser parte de una universidad y una universidad puede tener por parte a un museo, pero no necesariamente un museo es parte de una universidad ni una universidad tiene por parte a un museo) (a3).- facultativa/canónica (p.e. 'editorial'-'periódico': un periódico no necesariamente tiene editorial -en el sentido de artículo de opinión, no de empresa editora-, pero un editorial es necesariamente parte de un periódico). Otro ejemplo sería 'tejado'-'casa': no todas las casas tienen tejado, pero un tejado siempre lo es de una casa. (a4).- canónica/facultativa (p.e. 'líquen'-'hongo', ya que al parecer un líquen necesariamente tiene por parte a un hongo, pero un hongo puede tener existencia autónoma y no necesariamente es parte de un líquen). (b).- Congruencia. Este factor es parecido al de la opcionalidad de la relación pero no idéntico a él. La diferencia se halla en que en el caso de la opcionalidad se considera que cualquier ejemplar del holónimo puede o no estar en relación con el merónimo, o viceversa (p.e., cualquier periódico puede tener o no editorial); sin embargo en el que nos ocupa ahora la opcionalidad no es libre sino condicionada a un subtipo específico (p.e. no cualquier flor puede o no tener sépalos, sino que ciertas flores necesariamente los tienen y otras necesariamente no los tienen). Esta característica da lugar básicamente a dos tipos de holonimia/meronimia: aquél en que el merónimo es más general que el holónimo (p.e. 'nail' ('uña'), en relación a 'finger' ('dedo de la mano') y 'toe' ('dedo del pie'), puesto que 'nail' es merónimo tanto de uno como de otro pero no de forma indiscriminada, las uñas de los dedos de las manos son diferentes de las de los dedos del pie; y aquél en que el holónimo es más general que el merónimo (p.e. 'flor'-'sépalo' y 'cuerpo'- 'útero', dado que un cuerpo tiene o no útero dependiendo de si es femenino o masculino). La terminología utilizada por Cruse al respecto es la siguiente: 'dedo' es super-merónimo de 'mano' y 'pie', y éstos son hipo-holónimos de 'dedo'; 'cuerpo' es super-holónimo de 'útero', y éste hipo-merónimo de 'cuerpo'. (c).- Espectro de sentidos relacionados. Es el caso del típico ejemplo de Lyons (1977) 'puerta'-'empuñadura' ('door'-'handle'). Este factor hace que sea dudoso afirmar que '?a handle is a part of a door', pero no que 'a door has a handle'. 'Handle' debería considerarse un super-merónimo de 'door', dado que puede hablarse de 'handles' de puertas, de cajones y de cucharas; pero considera Cruse que, de forma más precisa, lo que ocurre es que existen varios sentidos para 'handle' estrechamente relacionados, uno de los cuales sería [empuñadura de puerta], otro [empuñadora de cajón] y otro [mango de cuchara]. (d).- Holo-meronimia. Se da cuando un término puede denotar alternativamente la parte de un todo, o el todo en sí. Es el caso de 'blade' (aproximadamente, 'brizna', u 'hoja' en sentido restrictivo, es decir, la hoja sin el tallo), que puede ser merónimo de 'leaf' ('hoja') si la hoja tiene tallo, o denotar la hoja entera si no lo tiene. Un ejemplo en castellano de holo-meronimia es la relación existente entre 'piso' y 'casa' -en su sentido de [morada, lugar donde uno vive]-: un piso puede ser una parte de la casa (si ésta tiene planta baja y piso/s) o toda la casa en sí. Diferentes tipos de cohesión parte-todo en el tipo central de meronimia. Cruse expone dos tipos de oposición que tienen que ver con formas divergentes de integración de la parte en el todo: (a).- Partes unidas vs. partes integradas. El ejemplo prototípico de dicha diferenciación es la existente entre 'palma' y 'dedo' respecto a 'mano'. La palma es una parte integrada, no separable, de la mano: no puede concebirse una mano sin palma y las expresiones '*una mano sin palma' o '*la palma está unida a la mano' no son admisibles. El dedo, sin embargo, es separable de la mano: una mano es concebible aunque le falte algún dedo, y las expresiones 'una mano sin dedos' o 'el dedo está unido a la mano' son aceptables. La noción fundamental subyacente a esta distinción es que un todo no queda destruido si le falta una 'parte unida', y sí si le falta una 'parte integral'. (b).- Partes sistémicas vs. partes segmentales. Tomando nuevamente como ejemplo el cuerpo humano, consideraremos que 'cabeza', 'brazos', etc. son partes segmentales y 'nervios', 'músculos', 'arterias' etc. partes sistémicas. Las primeras están dispuestas de modo secuencial, se desarrollan a lo largo de los ejes espaciales mayores de un todo y muestran un mayor grado de cohesión espacial; las segundas son topológicamente interpenetrantes y muestran una mayor unidad funcional y de constitución que las primeras. Apunta Cruse que el lenguaje ordinario tiene mayor preferencia por dividir un todo en partes segmentales. II. Clases no centrales de meronimia. Describe Cruse una pléyade de relaciones parte-todo que, aunque no considera sean en sentido estricto meronimias, sí pueden ser vistas como cercanas o similares a ella. Son las siguientes: (a).- Lugares incluídos en los límites de otros lugares, como p.e. Francia:Europa. Considera que son más 'porciones' que 'partes', como demuestra la inaceptabilidad de '*Europa tiene Francia', y deben tomarse más como aspectos terminológicos peculiares que como relaciones parte-todo. Sin embargo, añade, ello no es tan claro en una relación del tipo capital:país, ya que sí es aceptable 'un país tiene una capital'. (b).- Partes de entidades con estructura temporal, como 'strip-tease:show', 'movimiento:sinfonía'. Todo suceso que tenga una duración en el tiempo es susceptible de ser dividido en partes, denominadas 'estadios' o 'fases'. Como en el caso de las entidades, pueden ser segmentales (caso de 'movimiento'-'sinfonía') o sistémicas ('strip_tease'-'show').Tambien pueden considerarse relaciones de orden más periférico como partes de estados ('autocontrol'-'madurez', 'el autocontrol es parte de la madurez') o rasgos típicos de eventos ('calor'-'verano', 'el calor es parte del verano'). (c).- Medidas, como 'gramo'-'kilo'. Cruse no considera esta relación como estrictamente meronímica por no ser ramificante. La característica principal es la total falta de diferenciación entre las partes (un gramo es exactamente igual a otro gramo) (d) Colectividades,
como 'tribu', 'clero', 'bosque' o 'rebaño'. Este tipo de entidades está
menos integrado estructuralmente que los objetos, y sus partes son todos
independientes -y a menudo indiferenciados- de un tipo más básico.
Distingue Cruse entre cuatro tipos de relaciones colectividad-miembro: (d.1).- Grupo-Miembro, como en 'tribu', 'equipo', 'comité', 'familia', 'orquesta' o 'público'. Parecen restringidos a asociaciones de humanos y suelen designar un propósito o función común de la colectividad. En algunos casos existen nombres específicos para los elementos del grupo ('músico', 'senador'). Se caracterizan morfosintácticamente en inglés por admitir el plural ('teams' -'equipos'-) y poder concordar con el verbo indistintamente en singular o plural ('the team is/are under investigation'). (d.2).- Clase-Miembro, como en las relaciones 'proletariado'-'trabajador', 'clero'-'obispo' o 'aristocracia'-'duque'. En este caso la agrupación está justificada más por atributos comunes que por la función de la colectividad; es orgánicamente menos cohesiva que un grupo y sus miembros son menos claramente partes que los elementos de grupos. Morfosintácticamente, parecen rechazar el plural (?'aristocracies') y prefieren la concordancia en plural ('the aristocracy were/?was unhappy'). (d.3).- Colección-Miembro, como en 'bosque'-'árbol', 'montón'-'piedra' o 'biblioteca' (en el sentido de colección, no de lugar)-'libro'. Son típicamente agrupaciones de objetos inanimados. La relación de miembro a colección suele ser facultativa y la inversa necesaria (un árbol no tiene por qué ser parte de un bosque, pero un bosque está formado por árboles). Los nombres de colección son pluralizables ('forests' -'bosques'-), pero si están en singular no pueden concordar con el verbo en plural ('the forest is/*are necessary') (d.4).- Grupo de Animales-Animal ('rebaño', 'piara'). Para Cruse esta relación es intuitivamente diferente de la de grupos de humanos ya que el nombre de la agrupación comparte propiedades morfosintácticas de las relaciones de Grupo y de Colección, ya que en inglés '?the herd are...' -'el rebaño son...'- no parece aceptable, pero 'the (wolf) pack have...' -'la jauría (de lobos) han...'- sí lo es. (e).- Ingredientes o constituyentes ('acero'-'coche', 'café'-'café con leche'). Se caracterizan porque la parte es un nombre de masa, y refiere a sustancias usadas en la preparación del todo o que forman parte de su composición. (f). Partículas de sustancias ('grano'-'arena'). En este caso el nombre de masa es el todo, mientras que la parte es contable. Sucede cuando el todo es una sustancia que, examinada con detalle, resulta estar compuesta de partículas. Hasta aquí hemos
visto el análisis de la meronimia hecho por Cruse. Examinemos en la sección
siguiente cuáles son las líneas generales de las aproximaciones relacionales
en las que ésta se incluye. A pesar de que los autores relacionados hasta aquí siguen dos líneas distintas de definición de las relaciones meronímicas -los lingüistas, a partir de tests de aceptabilidad; los psicolingüistas, a partir de elementos conceptuales abstractos subyacentes-, todos ellos concuerdan en afirmar que no existe una sola sino una vasta familia de relaciones léxicas parte-todo. Definir las propiedades de transitividad de las mismas parece ser algo difícil de articular. Winston et al. postulan que la relación parte-todo es transitiva mientras se mantenga dentro de un mismo subtipo; sin embargo Cruse hace notar la dificultad de mantener tal aseveración en todos los casos. La multiplicidad de clasificaciones ofrecidas y la heterogeneidad de los factores que en ellas se manejan parece ser reflejo de la dificultad de llegar a una delimitación clara de los diferentes tipos de relaciones meronímicas. Con el paso del tiempo, la clasificación que ha adquirido mayor grado de consenso (cf. Saint-Dizier y Viegas, 1995), quizá por ser la que propone un número más reducido y general de tipos y una mayor claridad de definición de los mismos, es la de Winston et al. (1987), que repito a continuación: • componente
/ objeto integral (relación estructural y funcional clara antre el todo
y las partes) Esta clasificación, como veremos en el capítulo siguiente, es la que sirve de base a los modelos computacionales de representación del conocimiento léxico WordNet y EuroWordNet. En muchos aspectos, quizá debido a su voluntad generalizante, la clasificación de Winston et al. resulta demasiado esquemática, debiendo ser tenidas en cuenta diversas apreciaciones de Cruse, de las que cabe destacar como más relevantes las siguientes: • Existen múltiples factores que interfieren en la tarea de establecer relaciones meronímicas unívocas y bien definidas, siendo los más destacables diversos grados de opcionalidad de las relaciones, así como, inevitablemente, los diversos grados de polisemia a que se hallan sujetos los lexemas que son términos de las mismas. • Desde el punto de vista lingüístico, es difícil fijar un conjunto claro y bien definido de tests de aceptabilidad que den cuenta de forma clara y discriminativa de la relación parte-todo en general y de sus diversos subtipos. • La relación establecida entre (nombres denotadores de) objetos físicos tangibles y sus partes estructurales son concebibles como el ejemplo central de relación meronímica, siendo los demás tipos de meronimia de orden marginal o secundario. • Parece necesario establecer una distinción entre relaciones meronímicas (o de parte) y relaciones de porción. Para Cruse la distinción fundamental entre ambas debe hallarse en que las partes tienen una función distintiva respecto al todo, y los porciones no. Un segundo criterio a tener en cuenta es el de delimitación: los límites de las partes son motivados y los de las porciones, arbitrarios. • Un aspecto a ser tenido en cuenta es el de la lexicalización de las relaciones parte-todo. Para Cruse las relaciones de porción no lexicalizan y las relaciones meronímicas sí. Esta última afirmación, como veremos ampliamente más adelante, es discutible. Tanto la clasificación de Cruse como las diversas clasificaciones del equipo de Chaffin y Herrmann contemplan relaciones meronímicas del tipo 'grano' / 'arroz' o 'rebanada' / 'pan', las cuales no pueden ser consideradas en puridad como relaciones parte-todo lexicalizadas, sino que más bien los nombres de parte ('grano' y 'rebanada') parecen ser, más que nombres de objetos, predicados nominales susceptibles de ser aplicados, respectivamente, bien a c | |||||||||||||||||||||||