Ilustrados comunidad mundial educativa
Inicio | Escribenos
User: Pass: Recordar ó (Registrate!)

| !Publicar Articulo¡

Individuación e información Parte-Todo Representación para el procesamiento computacional del lenguaje

Resumen: En la comprensión del lenguaje juegan un papel determinante las relaciones tácitas que se establecen entre los distintos significados denotados por las unidades lingüísticas.
1,235 visitas
Rating: 0
Tell a Friend
Autor: Salvador Climent Roca

ÍNDICE 

Prefacio 

0. Introducción 

1. Marco general y cuestiones generales 

2. Aproximaciones al conocimiento parte-todo 
2.1 Enfoques léxico-relacionales: la meronimia 
2.2 Aproximaciones constructivistas 
2.3 Conclusiones 

3. Modelos computacionales 
3.1 WordNet 
3.2 EuroWordNet 
3.3 Representación del conocimiento léxico mediante estructuras de rasgos tipificadas: LRL-LKB 
3.4 Recapitulación 

4. Análisis del problema 
4.1 Lexicalización, individuación y categorización 
4.2 Propuesta de definición de los tipos de relación parte-todo 
4.3 Recapitulación 

5. Individuación mediante construcciones partitivas 
5.1 Nombres partitivos: aproximación funcionalista y similitud con clasificadores 
5.2 Propiedades generales de los nombres y grupos partitivos 
5.3 Conclusiones 

6. Representación formal del significado de los partitivos 
6.1 Marco teórico: el Lexicón Generativo 
6.2 Formalización de la semántica de los partitivos en el marco del Lexicón Generativo 
6.3 Conclusiones 

7. Polimorfismo léxico: alternancias de referencia y restricciones selectivas de los partitivos 
7.1 Polimorfismo léxico 
7.2 Clasificación de los nombres partitivos en función de sus restricciones selectivas 
7.3 Consideraciones finales 

8. Conclusiones generales 

9. Líneas de trabajo futuras 

Referencias 

Apéndice: extracción de relaciones meronímicas

 

El mundo era tan reciente, que muchas cosas carecían de nombre,
y para mencionarlas había que señalarlas con el dedo.

GABRIELGARCÍA MÁRQUEZ:
Cien años de soledad. 1975. Plaza y Janés. Barcelona.



   En la comprensión del lenguaje juegan un papel determinante las relaciones tácitas que se establecen entre los distintos significados denotados por las unidades lingüísticas. Tomemos por ejemplo el primer párrafo de 'El largo adiós', de Raymond Chandler:

   La primera vez que posé mis ojos en Terry Lennox, éste estaba borracho en un Rolls Royce Silver Wraith, frente a la terraza de The Dancers.

   Simplemente a partir de ese primer párrafo, el lector puede hacerse la siguiente composición de lugar: un tal Terry Lennox se hallaba en el interior de un coche, el cual se hallaba situado frente a un bar o restaurante. Las inferencias son posibles debido a que el lector tiene conocimiento de que (1) un Rolls Royce es un coche; y (2) una terraza es -en el sentido que resulta apropiado en el texto- la parte exterior, de cierto tipo de locales públicos.

    La inferencia (1) es debida, a grandes rasgos, a la relación semántica comúnmente conocida como relación Es-Un (o de Hiperonimia/Hiponimia); en este caso concreto, a una variante específica, la relación Instancia-De. Dicha relación ha sido ampliamente estudiada y cualquier tipo de lexicón para el tratamiento del lenguaje está organizado en mayor o menor medida basándose en la misma.

    La inferencia (2) es debida a la relación conocida como parte-todo (o de Meronimia/Holonimia). De este segundo tipo de relación semántica es del que trataremos aquí.

    Otro aspecto del fenómeno puede ser ilustrado a la vista del inicio del capítulo 14 de la misma novela:

   A la mañana siguiente me estaba limpiando el talco del lóbulo de la oreja cuando sonó el timbre. Fui a abrir la puerta y me topé con un par de ojos azul violeta.

En este caso la interpretación es que Marlowe, presumiblemente, ha abierto la puerta a una persona. Dicha interpretación es posible, en gran parte, a causa de una metonimia: los ojos son una parte del cuerpo; concretamente una parte del cuerpo que tiene una palabra específica para denotarla, 'ojo'. Pero no todas las partes de cosas pueden ser denotadas mediante una sola palabra. El 'lóbulo de la oreja', por ejemplo, es tan parte del cuerpo, como pueda serlo un 'ojo', y, al menos en castellano, se describe no mediante una sola palabra sino mediante una paráfrasis: un grupo nominal del que sobresalen un nombre que hace relación al todo, 'oreja'; y otro que hace ciertas precisiones sobre la parte en cuestión, 'lóbulo' -"cada una de las partes, a manera de ondas, que hacen saliente en el borde de una cosa; como en la hoja de una planta" (Casares, 1959)-.

    A este tipo de relación parte-todo, no léxica sino compositiva, le dedicaremos aquí una atención especial.

0. Introducción


    En este trabajo me he propuesto tratar de la codificación en el lenguaje del conocimiento parte-todo y de su representación computacional. Me ceñiré a la semántica léxica nominal del español, e intentaré dar, en dicho ámbito, con un tratamiento global e unificado del fenómeno.

    Se trata de un tema aparentemente heterogéneo, dado que abarca aspectos tales como la meronimia (o relaciones parte-todo entre lexemas), la pluralización (o expresión morfológica de una relación de elemento a multiplicidad), la polisemia lógica (como en la alternacia léxica entre la denotación de una entidad y la de la sustancia que la conforma), o los sintagmas partitivos (o expresión no léxica de relaciones parte-todo). Mi hipótesis es que todo ese abanico de fenómenos lingüísticos corresponde a un único y reducido conjunto de esquemas cognitivos, y puede ser explicado y representado en base a los mismos.

    En lo que resta de capítulo plantearé mi aproximación genérica al tema, para concluir con la presentación del esquema del trabajo.
 

    Planteamiento

    La capacidad de referirse a entidades como unidades discretas y diferenciables es un mecanismo del que, muy probablemente, cualquier lenguaje existente o concebible deba disponer. Algunos autores, como Lyons (1977), han denominado a dicho mecanismo, mediante el cual las lenguas entresacan entidades individuales de un continuum de referencia, individuación. De forma genérica, entenderemos por individuación la capacidad que tienen los hablantes para referirse a una determinada entidad o suceso de forma distinta y separada de un todo más inclusivo del que se concibe que forma parte.

    Con las debidas matizaciones, puede convenirse que el objeto de la comunicación humana, el mundo que nos rodea o cualquier otro mundo posible o imaginable, está conformado por una amalgama más o menos continua de entidades y sucesos que es preciso desbrozar para que la propia comunicación sea posible. Centrándonos en el caso de la individuación de entidades, se observa que las lenguas utilizan múltiples recursos para llevarla a cabo. En español, por ejemplo, puede usarse la referencia deíctica ('aquéllo') u otros pronombres ('él'), así como una gran variedad de sintagmas nominales ('dos árboles', 'una rama', 'muchas copas de vino', 'ese equipo', 'un montón de gente', 'una cabeza de ganado'). Otras lenguas utilizan recursos ligeramente diferentes; por ejemplo las lenguas con clasificadores (japonés, chino mandarín, thai) construyen la referencia individualizada mediante grupos nominales en los que el nombre o su especificador combinan con un morfema o lexema, denominado clasificador, el cual tiene una doble función: la de indicar que la entidad denotada es una entidad discreta y contable, y la de clasificarla de acuerdo con ciertas especificaciones semánticas y perceptuales, tales como tipo, forma, animacidad, consistencia, tamaño o disposición. Dichos clasificadores, utilizados en ausencia del nombre, tienen, como los pronombres en español, capacidad de referencia anafórica.

    De acuerdo con la corriente teórica habitualmente denominada gramática cognitiva, en el origen de la mencionada capacidad de individuación, se halla la capacidad de categorización. Desde dicho punto de vista (p.e. vid Lakoff, 1987; Rosch, 1976), determinados elementos del continuo son percibidos por los hablantes como propietarios de rasgos recurrentes, por lo que son considerados como pertenecientes a una categoría conceptual. Por ejemplo, observado que la gran mayoría de las cosas a las que en castellano se denominan 'árbol' presentan en su parte superior un número indeterminado de apéndices en los que se situan las hojas y los frutos, es posible convenir que, pese a la gran diversidad de aspectos que ofrecen y a que físicamente forman una única unidad continua con el árbol, tales apéndices pueden reputarse como pertenecientes a una categoría de cosas, que en castellano recibe el nombre de 'rama'.

    La expresión lingüística de las categorías conceptuales está directamente relacionada con el fenómeno de la convencionalización, y por consiguiente con múltiples factores dependientes en último término de cada lengua en particular: cada lengua designa a los diversos rangos de entidades y sucesos de acuerdo con los mecanismos de que dispone. El grado máximo de convencionalización es la lexicalización, o expresión de un determinado concepto en una lengua mediante un determinado lexema. Grados menores de convencionalización resultan en la expresión de un concepto mediante construcciones expuestas a diversos grados de variabilidad, desde expresiones complejas prácticamente invariables, como las lexías, hasta estructuras sintagmáticas sujetas a un mayor o menor espectro de realizaciones alternativas, tanto en lo relativo a su estructura como a los elementos léxicos que en ella pueden insertarse.

    Sea de forma lexicalizada o sintagmática, diversos tipos de entidades pueden ser referidos de forma discreta e individualizada: individuos ('un árbol', 'un palo'); conjuntos o pluralidades de individuos ('una manada de elefantes', 'un comité', 'gente', 'personas'); cantidades de masas o substancias ('un vino', 'un vaso de vino', 'una madera', 'una barra de madera'); o partes, porciones o elementos de entidades individualizadas ('una rama', 'la cima de una montaña', 'una cabeza de ganado', 'uno del equipo').

    De modo íntimamente relacionado con la anterior apreciación, se constata que pueden definirse diversos tipos de relaciones de inclusión entre entidades (o, desde otro punto de vista, entre expresiones que las designan), como por ejemplo las existentes entre 'árbol' y 'rama', 'manada de elefantes' y 'elefante', 'barra de madera' y 'madera', o 'animal doméstico' y 'ganado'. Se trata éste de un tipo de conocimiento del que disponen los hablantes y que es profusamente utilizado en la construcción del significado del discurso lingüístico; por ejemplo, en una emisión lingüística en la que se manejen conceptos o palabras tales como 'ramas', 'copa', 'fruto', 'hojas', 'raíces', 'savia' o 'bosque', un hablante del español podrá deducir que, aunque no se cite de forma explícita, se está hablando de árboles.

    Tal tipo de información semántica, la información parte-todo, ha sido estudiada en profundidad desde el punto de vista lexicalista por autores como Cruse (1986) o Winston et al. (1987), los cuáles han postulado diversos tipos de relaciones entre todos y partes, o relaciones meronímicas, entendidas como uno de los medios de estructuración interna del lexicón. Dichas aproximaciones, por ser esencialmente léxico-semánticas, no abordan de manera directa el hecho de que las relaciones parte-todo no únicamente se realizan en el lenguaje en forma de relaciones tácitas entre lexemas, sino que también, como he sugerido antes, pueden ser expresadas a partir de unidades lingüísticas más complejas. Por ejemplo, un caso de individuación que da lugar a una relación meronímica nominal, como es el de 'meandro' respecto a 'río', es perfectamente análogo al que establece el sintagma 'brazo de río' en relación al mismo tipo de entidad global: en ambos casos se designa a una parte del río concebida como una entidad individual y diferenciada.

    Este tipo de grupos nominales partitivos, como 'brazo de río', -compuestos de un nombre en función partitiva, la preposición 'de' y un nombre en posición de complemento que designa la entidad global de referencia-, constituyen uno de los modos fundamentales de denotación de categorías conceptuales no lexicalizadas en español, y realizan funciones semánticas análogas en muchos aspectos a las que realizan los nombres comunes, como por ejemplo la de establecer relaciónes parte-todo entre entidades; pero no únicamente éstas, sino que, del mismo modo que los clasificadores en otras lenguas, también aportan información de otros tipos (forma, magnitud, etc.).

    El análisis de las construcciones partitivas en español y de sus clases nos llevará a examinar qué tipos de nombre pueden ocupar en diferentes casos cada una de las posiciones del sintagma. La observación de la posición del complemento y el objetivo de definir sus características semánticas conducirá a su vez al planteamiento un problema de polisemia nominal que denominaré polimorfismo referencial.

    Tómense en consideración dos sintagmas partitivos como 'un montón de café' y 'un montón de cafés', en los que en ambos casos se formula una cuantificación respecto a un todo de referencia -café- pero con diferentes matices de significado. El primer sintagma es monosémico: en él se cuantifica en relación a la sustancia denominada 'café'. El segundo sintagma, en cambio, es ambiguo, y, además, en él el todo de referencia es semánticamente distinto del del primero: 'un montón de cafés' podrá referirse, bien a tazas -o dosis convencionales- de café (como en 'para mantenerme despierto tomé un montón de cafés'), bien a clases -o subtipificaciones de la clase genérica- de dicha sustancia (como en 'en el nuevo supermercado puedes elegir entre un montón de cafés'). La situación que sugieren los anteriores ejemplos es la siguiente: un mismo lexema es susceptible de denotar conceptos que son distintos, pero que sin embargo se hallan estrechamente relacionados tanto entre sí como con lo que pudiera considerarse un significado común básico subyacente a todos ellos.

    Éste y otros tipos similares de lo que podría calificarse como fenómenos de polisemia débil -denominados polisemia lógica por diferentes autores, como Pustejovsky (1995)- constituyen un fenómeno del que es preciso dar cuenta en el lexicón por las múltiples implicaciones semánticas que plantea, entre las que se cuenta la caracterización de los referentes de las construcciones partitivas, pero también otros aspectos del fenómeno parte-todo como la alternancia sustancia-entidad ('cordero' como animal vs. 'cordero' como plato o alimento) o la pluralización (expresión de una relación de elemento a multiplicidad).

    A lo largo de este trabajo analizaré los aspectos de la semántica nominal hasta aquí planteados con el objetivo de proponer una representación formal de los mismos en un lexicón computacional para el tratamiento del castellano. De forma más específica, trataré en primer lugar del conocimiento meronímico, y a continuación de la individuación mediante sintagmas partitivos y del fenómeno relacionado del polimorfismo referencial, aspecto este último para el cual me basaré en el trabajo desarrollado por Jackendoff (1991) sobre formalización del sustrato conceptual que desde su punto de vista subyace al conocimiento léxico.
 

    Esquema del trabajo

    Tras un primer capítulo destinado a cuestiones preliminares (Cap. 1) presentaré las distintas aproximaciones al fenómeno parte-todo (Cap. 2) y los modelos computacionales de representación del conocimiento que son relevantes para el presente trabajo (Cap. 3). En el siguiente capítulo (Cap. 4) formularé mi propio análisis, para pasar a continuación a examinar con más detalle el problema de las relaciones parte-todo expresadas mediante construcciones partitivas (Cap. 5). En Cap. 6 describiré el marco de representación del conocimiento léxico, basado en Pustejovsky (1995), dentro del cual desarrollaré (en Cap. 6.2) la formalización de diversos modos de individuación sintagmática del conocimiento parte-todo, mostrando sus implicaciones para el tratamiento de la semántica compositiva de la oración. Para un adecuado tratamiento de los sintagmas partitivos y también de otros aspectos del fenómeno, como la pluralización o la alternancia léxica sustancia-entidad, presentaré en Cap. 7 un modelo de representación del polimorfismo referencial. Para finalizar expondré las conclusiones del trabajo y las líneas futuras de investigación.

1. Marco general y cuestiones preliminares


    La lingüística computacional trata de la formalización o codificación del lenguaje natural en un lenguaje formal, tratable por medios informáticos con fines aplicados diversos, tales como traducción automática, acceso a bases de datos, extracción de información de textos o comunicación con sistemas informáticos -es decir, con lenguajes formales- mediante el lenguaje natural. En la última década, gran parte de la investigación en lingüística computacional se ha centrado en la semántica léxica, a partir de la constatación de que una parte muy considerable de la información lingüística reside, o puede ser explicada, a partir de la información contenida en las entradas léxicas.

    Coexisten en este momento diversos tipos de aproximación a la lexicografía computacional, cada uno de ellos con diversos grados de compromiso con respecto a formulaciones teóricas del campo de la lingüística, la psicolingüística, la filosofía del lenguaje o la ciencia cognitiva. Aunque en último término la lingüística computacional, no depende de forma inexcusable del seguimiento de una u otra teoría lingüística o cognitiva, resulta obvio señalar que, con carácter previo a la formulación de cualquier tipo de representación computacional del lenguaje, es preciso haber tomado antes cierto tipo de decisiones previas acerca de cómo se va a abordar el lenguaje natural y qué aspectos del mismo se considera preciso representar.

    Para los propósitos finales de este trabajo -la formulación de representaciones lingüísticas tratables computacionalmente- entenderemos en principio la lingüística, en un sentido ciertamente amplio, como la descripción de una lengua; y de forma más específica, como la construcción un modelo de las regularidades que, a juicio del lingüista, se manifiestan en el uso de una lengua. Ello implica asumir la idealización estructuralista del lenguaje como sistema ontológicamente exterior a los hablantes (aunque por supuesto conocido, compartido y usado por ellos con objetivos semióticos varios). Asimismo, el objeto de la descripción, 'la lengua', se entenderá como 'una lengua' en particular, en este caso el castellano. Cabe resaltar que ambas asunciones son de tipo metodológico; por consiguiente no entraré aquí en disquisiciones sobre la entidad real del lenguaje bien como sistema, bien como capacidad mental (competencia), o sobre las presuntas cualidades de universalidad o innatismo que puedan atribuírsele.

    Sin embargo, estas consideraciones no deben ser entendidas como un modo de desentenderse de la teoría. Por el contrario, los modelos de representación del conocimiento son en gran medida deudores de modelos o ideas provinentes de los campos de la psicolingüística y la ciencia cognitiva; existiendo un notable consenso en la comunidad investigadora respecto a que los modelos computacionales del lenguaje deben ser, en la medida de lo posible, un reflejo de los modelos mentales. Siendo el lenguaje una facultad cognitiva humana, es de esperar que un modelo formal del lenguaje resultará tanto más acertado en cuanto mejor modelo sea de dichas facultades cognitivas. Éste es también mi convencimiento. Como podrá comprobarse en lo sucesivo, las representaciones computacionales que formularé a lo largo de este trabajo estarán basadas en ideas provinentes de la psicolingüística y la ciencia cognitiva; en especial en el modelo relacional de la memoria léxica, en la gramática cognitiva, y en las hipótesis semántico-conceptuales de Jackendoff.

    Por otra parte, formular algún tipo de análisis o representación del léxico de una lengua, implica, por una parte, utilizar una terminología metalingüística para manejarse en dicho terreno; y por otra, pretender que de algún modo se está representando o aludiendo a algo de tan difícil definición como es 'el significado' de las palabras. Como es sabido, la elucidación de qué es o qué puede entenderse exactamente por significado así como, de forma inseparable, la definición de términos tales como 'significado', 'sentido', 'referencia', 'denotación', 'designación', etc., es una materia que ha ocupado y sigue ocupando a filósofos y lingüistas como mínimo desde la Grecia clásica. No puedo pretender terciar en tan arduo debate, sino tan sólo situarme mínimamente en dicho marco a fin de utilizar una terminología metalingüística lo menos gratuita posible. Para ello describiré en primer lugar de modo necesaria y deliberadamente esquemático los modelos fundamentales o tendencias mayoritarias a partir de las cuales se han desarrollado la mayor parte de formalismos de representación del significado.

    Básicamente, existen dos tipos de aproximación a lo que pueda significar el 'significado' de una expresión de un lenguaje: una (habitualmente denominada 'realista') que parte de Aristóteles, y otra (a la que podríamos llamar 'abstraccionista') que emerge de la obra de Platón.

    Ambas aproximaciones comparten la muy sensata asunción de que existe la realidad, es decir, el mundo nuestro de cada día, con sus gatos, sus alfombras, sus árboles, sus sillas y sus taburetes; y también la constatación de que la organización de dicho mundo en entidades individualmente designables no es en absoluto un asunto trivial (son famosas en semántica lingüística las discusiones sobre qué es una silla y qué un taburete; tampoco es fácil decir si una mecedora o una silla eléctrica deben ser contadas como sillas; o si cada árbol viene determinado por la existencia de un tronco, o quizá por la existencia de un conjunto común de raíces, bajo tierra o a una distancia prudencial -¿cuál?- sobre el nivel del suelo). Sin embargo, una y otra difieren en que mantienen posturas radicalmente diferentes sobre si un lenguaje (el lenguaje natural o cualquier otro) puede o no (y si puede, cómo) describir el mundo, o 'referirse' a él.

    La aproximación realista mantiene que las unidades del lenguaje refieren directamente a entidades del mundo (ver fig. I.1). Los desarrollos basados en la misma utilizan para tal propósito la herramienta formal denominada 'conjuntos': dado un universo (que por otra parte puede ser el mundo físico, un mundo abstracto, o cualquier mezcla de ambos), las entidades en él vienen de un modo u otro individualizadas, y estas individualidades se agrupan de forma natural en clases, definibles mediante condiciones necesarias y suficientes, y por tanto formalizables mediante conjuntos. En los modelos derivados de la aproximación realista no importa demasiado saber cómo se produce la individuación, de hecho puede producirse de infinitos modos: lo relevante es que cada modo de individuación corresponde a posibles conjuntos. Así, puede haber un conjunto que contenga todo tipo de sillas, sillas eléctricas incluídas, otro que no incluya sillas eléctricas pero sí tronos y mecedoras, y un tercero que incluya sillas, sofás, serpientes venenosas y personajes de "El Quijote".


Fig. I.1: La significación según el modelo realista

    Por contra, desde un punto de vista platónico o abstraccionista, se considera que un lenguaje no puede referir al mundo, sino únicamente a un universo consistente en abstracciones u objetos de orden matemático, cuya naturaleza ontológica es completamente disjunta de la de las colecciones de objetos del mundo real (ver fig. I.2).


Fig. I.2: La significación según el modelo abstraccionista

    Ambos modos de comprender la significación de un lenguaje son formalizables, y de hecho han sido formalizados, mediante una semántica teórica de modelos, es decir, un sistema consistente en (i) un lenguaje o formalismo que disponga, entre otros recursos, de nombres (propios) para individualidades y nombres (comunes) para conjuntos de ellas; (ii) un universo (o múltiples universos posibles) que conste de individualidades de referencia; y (iii), un conjunto de valores de verdad (Verdadero y Falso) que relaciona uno con otro.

    En todo caso, la diferencia fundamental entre las aproximaciones realista y abstraccionista es que en la segunda, al contrario de lo que sucede con la primera, el universo del discurso no puede en ningún caso entenderse como el mundo. Por tanto, dicha aproximación introduce la noción de un tercer nivel de representación semántica: un nivel abstracto distinto de los niveles del lenguaje y del mundo de referencia. Desde este punto de vista, que ha dado origen a la mayoría de los modelos semióticos y lingüístico-semánticos que hoy nos son familiares, el lenguaje (A) puede describir el mundo (C), pero debe hacerlo a través de la mediación del nivel abstracto intermedio (B). Por contra, desde el punto de vista realista, A y B son básicamente la misma cosa: los signos de A no son sino nombres para las categorías de B.

    Los principales herederos de la concepción platónica del significado son el modelo de Frege (1892) y el de Ogden y Richards (1923). En este último -en el que ya se entiende abiertamente 'lenguaje' como 'lenguaje natural'- los tres niveles son los denominados (A) Símbolo, (B) Pensamiento y (C) Referente (ver fig. I.3), los cuales, según Hayes (1994), deben ser entendidos como A:Lenguaje, B:Significado, C:Mundo. La noción subyacente, sin embargo, no es en absoluto novedosa, dado que puede ser hallada anteriormente (cf. Serrano, 1983) en los estoicos (que diferencian "aquello que es significado", "aquello que lo significa" y el "objeto"), en San Agustín (quien en 'De Dochtrina Cristiana' asimismo plantea una distinción entre signo, significado y cosa) y en los escolásticos medievales (cf. Ullmann, 1962), que acuñaron la máxima "vox significat mediantibus conceptibus" (la palabra significa mediante los conceptos).


Fig. I.3: El lenguaje según el modelo de Ogden y Richards (I)

    Este tipo de modelos suele ser representado gráficamente de modo más habitual mediante un triángulo como en la fig. I.4, en el que, dependiendo de cada aproximación en particular, cada nivel (especialmente el nivel abstracto, B) y cada relación entre niveles goza de distinta naturaleza ontológica, recibe distinto tipo de contenido y, en definitiva, es denominado de forma diferente. En todo caso, se asume que el nivel B es, aparte de un nivel abstracto, algún tipo de estructura o representación mental, llámesele 'pensamiento', 'idea', 'significado' o 'concepto'. En cuanto a las relaciones que ponen en correspondencia a los niveles de representación, Ogden y Richards las denominan de la siguiente forma: un símbolo 'simboliza' un pensamiento (r1); un pensamiento 'refiere' a un referente (r2); y un símbolo 'representa' a un referente (r3).


Fig. I.4: El lenguaje según el modelo de Ogden y Richards (II)

    El diagrama de la fig. I.4, sin embargo, no contempla la posibilidad de que, permaneciendo un referente inalterado, el significado de un nombre pueda cambiar para el hablante, sea por causa de alguna alteración en la percepción, en el conocimiento o en el sentimiento hacia el mismo.

    Frege (1892) sí había abordado el problema, estableciendo la distinción del contenido significativo entre 'referencia' -bedeutung- y 'sentido' -sinn-, según la cual dos signos (p.e. 'el lucero del alba' y 'la estrella de la noche') pueden tener un mismo referente (el planeta Venus), pero diferente 'sentido'; e incluso un signo (p.e. 'el cuerpo celeste más alejado de la tierra') puede tener sentido pero es dudoso que tenga referencia.

    En la terminología de Frege, un 'signo' expresa un 'sentido'; un 'sentido' designa una 'referencia'; y un 'signo' tiene una 'referencia' -ver fig. I.5-.

    Es preciso hacer notar dos aspectos que diferencian al modelo fregeano de los modelos mentalistas al estilo del de Ogden y Richards.


Fig. I.5: La significación según el modelo de Frege

    En primer lugar, adviértase que para Frege, el 'sentido' no es la representación que se pueda formar en la mente: la representación mental es un objeto individual y subjetivo, mientras que el 'sentido' fregeano es un ente objetivo, propiedad común de muchos y susceptible de ser transmitido de generación en generación. En consecuencia, no debe confundirse el nivel B de Odgen y Richards -de orden mental- con el nivel B de Frege, el 'sentido' -de orden estrictamente abstracto-.


Fig. I.6: Comparación de los modelos platónico y fregeano

    En segundo lugar, debe hacerse notar que para Frege, el nivel de los referentes no es el mundo real, sino el mundo de los conceptos (en los que, en su terminología, 'caen' los objetos o extensiones del mundo real, pero que no son objetos del mundo real). Por consiguiente, el triángulo signo-sentido-referente -o en su equivalente para expresiones: expresión-sentido-concepto- de la semántica de Frege, no es análogo al triángulo de Ogden y Richards (fig. I.4) ni al genérico de los modelos platónicos (fig. I.2), dado que en Frege el mundo real de nuestras cosas cotidianas no juega papel directo alguno (únicamente el papel indirecto de 'caer' en clases de referentes). Por contra, el nivel B (o 'sentido') de Frege debe ser interpretado como un nuevo nivel interpuesto entre los niveles A y B de los modelos filoplatónicos, correspondiendo el nivel C de Frege ('referentes'/'conceptos') al nivel B de estos últimos (ver fig. I.6).

    Finalmente, apuntemos que el modelo semántico fregeano también es representable, por supuesto y por antonomasia, mediante una semántica teórica de modelos.

    Otra manera de enfocar el asunto, la cual parece representar la primera gran alternativa a los modelos platónico y aristotélico, es la que emerge de los trabajos de Putnam (1981) en filosofía, Rosch (p.e., 1973) en psicología cognitiva, Langacker (1991) en lingüística, y otros en diversos campos, y se compendia y extiende en Lakoff (1987): la aproximación 'constructivista' o 'cognitivista'. El punto básico de dicha aproximación es la negación de la validez como teorías semánticas de los modelos basados en aparatos lógico-simbólicos (conjuntos, condiciones de verdad, etc.) en tanto en cuanto "el significado no puede ser caracterizado por la manera en que unos símbolos son asociados a cosas en el mundo" (Lakoff, op.cit.). El cognitivismo desplaza del centro del debate semántico a los formalismos y sitúa en su lugar al hombre y a sus capacidades (cognitivas) de comprensión o 'construcción' de la realidad externa.

    Una visión prejuzgadora del cognitivismo, como la propia de Hayes (1994), considerará la aproximación como confusa y en definitiva poco científica en tanto la entiende como poco menos que la asunción de una incapacidad para referirse al mundo real; y podrá emparentarla, peyorativamente, con la idea de Whorf (1956) de que el mundo exterior, sin el lenguaje, no es mas que un caos inefable. Una visión filosóficamente favorable, por contra, la emparentará con el más prestigiado Wittgenstein (p.e., 1953) en el sentido de que no debe abordarse el problema de la significación como un terreno en el que las palabras sean las protagonistas exclusivas en tanto que objetos autónomos contenedores de significado.

    El cognitivismo reclama la influencia de Wittgenstein en varios aspectos, y no rechaza de plano la de Whorf (y Sapir); pero lo que en ningún caso debe entenderse acerca de esta aproximación es que (como parece entender Hayes) niegue la existencia o la posibilidad de acceso a una realidad objetiva. El cognitivismo simplemente dice que no puede existir una descripción objetivamente correcta de la realidad, sino que existen múltiples maneras de describirla o comprenderla, y en todo caso éstas son fruto de una construcción (mental, y más o menos antropocéntrica) que hacen los hablantes de la propia experiencia.

    El modelo cognitivista puede ser representado esquemáticamente del mismo modo que el de Ogden y Richards (1923) (ver fig. I.4) ya que también en éste se postula la existencia de objetos mentales que median entre el lenguaje y el mundo externo. La diferencia fundamental radica en la naturaleza de los mismos. En primer lugar, para el cognitivismo dichas estructuras no son estrictamente lingüísticas sino que forman parte de los sistemas cognitivos generales y, de manera decisiva, no se consideran objetos con referencia en entidades del mundo real (u otros mundos posibles) sino modos de aprehenderlo y construirlo en la mente. Por otra parte, las clases mentales en que se organiza dicho conocimiento no pueden ser vistas como conjuntos de elementos sino como categorías difusas definibles a partir de prototipos (ejemplares centrales o idóneos) o esquemas estereotípicos.

    En otro orden de cosas, se considera que dicho sistema de representaciones mentales es, como en el caso del 'sentido' de Frege, algo compartido por los hablantes de un mismo sistema cultural (típicamente con reflejo en un mismo sistema lingüístico); y, como en los modelos de inspiración platónica, la relación de significación básica se establece entre el nivel lingüístico (A) y dicho nivel abstracto (B).

    El modelo cognitivista, por definición, no es representable, mediante una teoría semántica de modelos.

    Los modos básicos de entender la significación que hasta aquí hemos esbozado (el realista o aristotélico, el platónico-fregeano, y la alternativa constructivista a los dos anteriores) son filosóficamente irreconciliables. Sin embargo, ello no debe sumir en el desconcierto al lingüista computacional de modo que su trabajo quede bloqueado a la espera de la resolución de tales problemas filosóficos. La función del procesamiento computacional del lenguaje es la resolución de problemas observables en el comportamiento del nivel A (el lenguaje); lo cual es realizable utilizando un sistema de representaciones formales que, en principio y como marco de trabajo, puede ser independiente de modelos epistemológicos.

    En los modelos computacionales del significado habitualmente utilizados, como los que se manejarán en este trabajo, se asocia a los signos lingüísticos información codificada mediante representaciones formales tomadas de un metalenguaje y ancladas en algún nivel a entidades de un universo ontológico de referencia formado por símbolos denominados tipos. En este orden de cosas las representaciones de los signos lingüísticos pueden ser tomadas como los signos (nivel A de los diferentes modelos semánticos) y la ontología de referencia como un modelo del mundo extralingüístico (cuyo status comentaremos a continuación, pero que es asimilable en términos generales al nivel C de Frege en tanto que, por su propia naturaleza, no puede ser una representación objetiva del mundo, sino un modelo interpretado del mismo).

    En un sistema de representación computacional, el haz de información semántica asociada a cada signo lingüístico puede se tomado como el nivel B, interpuesto entre los signos y el universo de referencia. No es necesario a efectos de representación mantener una postura beligerante sobre la naturaleza epistemológica de dicha representación semántica. Basta con asumir simplemente que se trata de un nivel intermedio entre los significantes lingüísticos y el mundo extralingüístico, necesario a efectos explicativos. A grandes rasgos puede ser considerado como el significado en un sentido vagamente saussuriano, pero un realista podrá tratar dicha representación en términos de conjuntos (y definirlos por extensión o intensión); un platónico podrá verla como una abstracción o concepto; un fregeano como el 'sentido'; y un cognitivista como un modelo cognitivo.

    Desde este punto de vista, las representaciones computacionales del lenguaje pueden ser interpretadas, mediante el esquema triangular habitual, como en la fig. I.7.

    Con el fin de fijar la terminología que utilizaré en el resto del trabajo -en definitiva éste es el objetivo fundamental de este capítulo- es preciso considerar con mayor detalle el papel del nivel C o mundo del que son modelo las ontologías de tipos en los sistemas computacionales. Asumiremos en primer lugar que, como indica el sentido común, existe el llamado mundo real, o nivel de las entidades directamente aprehensibles a través de los sentidos y de los hechos o situaciones en que dichas entidades se ven inmersas. Asumiremos asimismo que es posible utilizar el lenguaje para aludir al mundo y así comunicarse o interaccionar con otros hablantes. A la relación que se establece en el proceso comunicativo entre las expresiones del lenguaje y las entidades o hechos del mundo le denominaremos referencia. Así, diremos que las expresiones 'Micifuz', 'aquel gato' o 'el gato de mi padre' refieren a una misma cierta entidad del mundo real.


Fig. I.7: Interpretación de las representaciones computacionales
en un esquema semántico triangular

    La adopción del término 'referencia' para indicar esta relación es, aparte de habitual, de clara estirpe fregeana; y es preciso recordar al respecto que en puridad los referentes de Frege no son objetos del mundo, sino a los conceptos bajo los que caen dichos objetos. En otras palabras, el nivel C de Frege no es el mundo real sino una clasificación del mismo. Lo mismo ocurre con el universo ontológico de referencia en los modelos computacionales: por tratarse de un modelo no puede ser sino una clasificación, en definitiva una interpretación, del mundo extralingüístico.

    Indudablemente, por múltiples motivos antes apuntados y ampliamente discutidos desde Aristóteles hasta nuestros días, la anterior asunción, con parecer razonable, es claramente insuficiente, ya que evidentemente no toda expresión lingüística tiene un correlato evidente en el llamado mundo real. Hasta este momento no hemos hablado de unicornios, y eso debe reputarse como un defecto grave para cualquier aproximación a la semántica, por generalizante que, como ésta, sea. Es evidente que, aunque en el mundo real no existen unicornios (ni los personajes de El Quijote; ni pueda demostrarse que existan los protones o la justicia; ni esté ni mucho menos clara la existencia objetiva del mes de septiembre), los humanos -especialmente los lógicos- hablan de unicornios (y también de Sancho Panza, de protones, de la justicia y del mes de septiembre).

    Lo más sensato al respecto es suponer que tal tipo de cosas, si no son del mundo (C), deben ser de B. Sin embargo habíamos reservado B para conjuntos, significados, intensiones, conceptos, o categorizaciones de entidades, no para entidades en particular; y nadie puede impedir que a alguien le apetezca hablar de ('referirse a') el unicornio de Ctesias, el cual dicen fue visto hacia el año 400 a.d.C. Dicho ejemplar de unicornio, por poco probable que sea su existencia, debe considerarse como perteneciente a la más general clase de los unicornios. Luego la expresión 'el unicornio de Ctesias', aparte de manejar el concepto [unicornio], implica algún tipo de referencia a un unicornio en particular. Pero referencia, ¿dónde?

    La solución de compromiso la hallaremos acogiéndonos a la muy veterana noción lógica de los mundos posibles. Asumiremos que los unicornios son entidades de C, un C que ciertamente no es el mundo de las cosas tangibles nuestras de cada día, pero que a efectos comunicativos funciona como si lo fuera. En privado admitiremos que el C de los unicornios no es más que una ficción, una construcción de la mente, pero desde el momento en que dicha ficción es (o puede llegar a ser) compartida por hablantes distintos -en caso contrario no podría existir la comunicación y el lenguaje perdería la función que hace que nos ocupemos de él-, asumiremos que los hablantes están de acuerdo en que una palabra como 'unicornio' tiene referencia en un universo (C) sobre el cual se puede hablar.

    Tal asunción coincide básicamente con la noción de 'espacio mental' (Fauconnier, 1994), constructo teórico que sirve de marco para la fijación de la referencia en gramática cognitiva. Desde esta óptica, por ejemplo, 'Sancho Panza' se tomará como una expresión con referencia en el universo o 'espacio mental' que conocemos como 'El Quijote'.

    A tal respecto, es digna de ser tomada en consideración la idea de que dichos 'espacios mentales' o 'mundos posibles' están construidos en la mente de los hablantes a imagen y semejanza del mundo real, de forma que la maquinaria fundamental de referencia al mundo real es aplicable a la de los mundos posibles.

    Un ejemplo muy ilustrativo de cómo conceptos y entidades no reales se construyen a partir de conceptos y entidades realmente perceptibles podemos hallarlo en el mundo literario de Lovecraft. Como es sabido, las criaturas de Lovecraft son de índole considerablemente mucho más alejada de cualquier referente real que, por ejemplo, los personajes de El Quijote; sin embargo, tal universo literario, pese a su extrema extravagancia, es transmitido al lector de forma que éste puede compartirlo (y éste a su vez referirse a él en conversación con otras personas, por ejemplo, pero no necesariamente, con otros lectores de Lovecraft); luego tal universo de referencia es susceptible de funcionar, en la comunicación lingüística, del mismo modo que el mundo real. ¿Cómo se consigue ello? Como podremos comprobar en el párrafo siguiente (descripción de un monstruo, extraída de 'El horror de Dunwich'), no de otro modo que por el recurso constante a la analogía con conceptos con referencia en la realidad:

    Es mayor que un establo... todo hecho de cuerdas retorcidas... tiene una forma parecida a un huevo de gallina, pero enorme, con docenas de patas... como grandes toneles medio cerrados que se echan a rodar... no se ve que tenga nada sólido... es de una sustancia gelatinosa y está hecho de cuerdas sueltas y retorcidas, como si las hubieran pegado... tiene infinidad de enormes ojos saltones... diez o veinte bocas o trompas que le salen por todos los lados, grandes como tubos de chimenea, y no paran de moverse, abriéndose y cerrándose continuamente... todas grises, con una especie de anillos azules o violetas... !Dios del cielo! !y ese rostro semihumano encima...!

    LOVECRAFT, H.P. (1925) El horror de Dunwich [tr. esp. en Alianza Editorial. Madrid, 1993].

    En todo caso, una representación computacional del léxico de una lengua debe aspirar a representar todo tipo de léxico, tanto el que se entiende como con posible referencia en el mundo real como el que designa cualquier otro tipo de entidad imaginaria o imaginable. Para ello, el modo de proceder sin quedarse atorado en disquisiciones filosóficas pasa por asumir que el universo de referencia en las representaciones computacionales (nivel C en la fig. I.7) incluye no únicamente a las entidades con existencia real sino también a aquéllas con existencia en cualquier otro mundo expresable mediante el lenguaje.

    En un sistema de representación basado en estructuras de rasgos como el que utilizaré, los rasgos utilizados para la descripción han sido definidos previamente, como se ha dicho, en una ontología de tipos, que se asume como un modelo -más o menos acertado, y sin duda, como mínimo, incompleto- de las clases de entidades que conforman el conocimiento compartido por los hablantes de una lengua. En consecuencia, por ejemplo, en dicho formalismo se podrá expresar sin mayores remordimientos filosóficos que Sancho Panza tiene brazos, cabeza y piernas; y que un unicornio es como un caballo pero con un cuerno en la frente; siendo suficiente que [brazo], [pierna], [caballo], [cuerno], [unicornio] o [Sancho Panza], sean tipos definidos en la ontología; y sin que tenga mayor relevancia el que tales conceptos sean susceptibles de tener referencia en el mundo real, en un espacio mental de Fauconnier, o en alguna otra especie de mundo posible. Como corolario, también dicho universo de referencia podrá (probablemente deberá) contener los objetos del metalenguaje utilizado en las representaciones.

    Veamos un ejemplo de dicho panorama en la fig. I.8, en donde una representación parcial de un sistema de tipos (nivel C) contiene el universo general que es modelo del mundo de referencia, incluídos objetos imaginarios -como los unicornios- y abstractos -como los objetos del metalenguaje, incluidos los signos lingüísticos (nivel A) y las representaciones semánticas a ellos asociados (nivel B)-.


Fig. I.8: Sistema de tipos (parcial) de una representación computacional

    Por supuesto debe constatarse que la categorización o clasificación de entidades no es un asunto que esté en absoluto claro; es más, es probable que no sea objetivamente decidible; pero, una vez más, confiaremos en que existe algún tipo de convenio implícito o convención al respecto que los hablantes de una lengua conocen y comparten; y en definitiva, las representaciones lingüístico-computacionales del mundo de referencia simplemente aspiran a ser un modelo de dicho conocimiento compartido que sea utilizable para un cierto número de aplicaciones de ingeniería del lenguaje.

    Sentado todo lo anterior, fijemos por fin los términos que en lo subsiguiente voy a emplear para referirme a los objetos de B y sus relaciones con A y C. Habrá que hacer al respecto una nueva precisión. Hasta ahora hemos venido hablando de forma genérica de los niveles A (lenguaje, signos, palabras), B (conceptos, significados) y C (mundo). Sin embargo es preciso distinguir entre la semántica léxica y la semántica de las expresiones en el discurso. La segunda se fundamenta en la primera. En el primer caso la intención es caracterizar objetos abstractos, informalmente, 'palabras' (como por ejemplo 'gato'), que pueden tomar diversas formas (por ejemplo, 'gatos'), que se suelen nombrar mediante una de sus formas, llamada 'lema' (por convención, en castellano, para nombres es la forma singular, para verbos la infinitiva, para adjetivos la masculina singular), y que son susceptibles de ser utilizadas bajo alguna de sus formas en las expresiones lingüísticas (como por ejemplo en 'el gato de mi padre'). Es preciso pues distinguir entre dos triángulos A-B-C, el lexicológico y el de las expresiones.

    · En el modelo de las expresiones (ver fig. I.9), siguiendo, como se ha dicho antes, de forma laxa a Frege, llamaremos a los elementos del nivel A, expresiones (p.e. 'el gato'); y a sus correspondencias en el mundo (nivel C), referentes. A las correspondencias de las expresiones de A en el nivel B las llamaremos conceptos o significado de A. No creo que sea precisa una denominación especial para la relación de correspondencia entre significados (B) y referentes (C), pero en todo caso si hay que mencionarla será también como una relación de referencia (desprendiéndose del contexto que se trata de una vía indirecta de referencia). En cuanto a convenciones de notación, en lo subsiguiente utilizaré la forma entre comas simples para el nivel A, una expresión entre corchetes para el B, y ninguna notación en particular para el nivel C. Así, diremos que la expresión 'el gato de mi padre' significa [el gato de mi padre]; y que 'el gato de mi padre' se refiere al gato de mi padre.


Fig. I.9: Terminología relativa a las expresiones

    · En el triángulo léxico-semántico (ver fig. I.10), denominaremos a los elementos de A (abstracciones de las formas posibles de las palabras, unidades de significado léxico) lexemas, siguiendo la tradición filológica habitual. A su relación con los elementos de B (conceptos o significados) la denominaremos, siguiendo a Lyons (1977), denotación. Aunque quizá de forma estricta no quepa considerar que exista relación entre los lexemas y los referentes o entidades del mundo (C), diremos que los lexemas refieren potencialmente a las entidades de C. Así, diremos que el lexema 'gato' (A), denota el concepto o categoría [gato] (B) y tiene la capacidad de referir en el contexto de una expresión a los gatos que en el mundo hayan (C).


Fig. I.10: Terminología relativa a los lexemas

    Con estas precisiones y la esperanza de que el contexto desambigue cualquier otro modo menos laxo de hablar (como por ejemplo llamar 'palabras' a los 'lexemas'), creo que podemos pasar a tratar del lenguaje, el mundo, los conceptos, y de sus representaciones computacionales.

2. Aproximaciones al conocimiento parte-todo
 


2.1 Enfoques léxico-relacionales: la meronimia
2.2 Aproximaciones constructivistas
2.3 Conclusiones
 


    En este capítulo presentaré las aproximaciones teóricas que han tratado, desde diversos puntos de vista, el tema del conocimiento parte-todo relativo a entidades -por tanto codificado en el lenguaje mediante nombres-. Dichas aproximaciones pueden dividirse en dos clases principales: léxico-relacionales y constructivistas.

    Las aproximaciones del primer tipo son de orden exclusivamente lexicológico, luego no toman en consideración el modo sintagmático de individuación en el lenguaje. En dicho marco se asume que el significado léxico viene determinado por las relaciones que cada unidad establece con el resto del lexicón, tomado en su conjunto como una gran red semántica. Se trata pues, de aproximaciones de clara raigambre estructuralista, con diferentes matices. Por una parte, los análisis de Lyons y Cruse son de orden lingüístico-descriptivo, evitándose la toma de compromisos teóricos acerca de la posible realidad mental de las unidades léxicas y de las relaciones que entre ellas se establecen. En su trabajo el análisis semántico se fundamenta de forma exclusiva en juicios de normalidad o anormalidad respecto a la aparición de las unidades léxicas en diversos contextos lingüísticos. Por contra, los investigadores situados en el marco de la psicolingüística (Miller y Johnson-Laird; Winston, Chaffin y sus colegas) postulan la existencia real en la mente de una estructuración relacional del conocimiento léxico-semántico. En ambos casos, la relación parte-todo, o de meronimia, es considerada como uno de los tipos fundamentales de estructuración del lexicón, el cual se superpone a la relación taxonómica (o de hiponimia) y es en cierto modo transversal con respecto a ésta (ver fig. II.1).
 


Fig. II.1: Taxonomía y Meronimia
 

    El autor que trata de forma más extensa y precisa las relaciones de parte desde un punto de vista estrictamente lingüístico es Cruse (1986), partiendo de las consideraciones previas de Lyons (1977). La aproximación de Cruse, sin embargo, no puede desligarse de los modelos psicológicos de la memoria léxica. Ciertamente, ni Cruse ni previamente Lyons reclaman para sus análisis status alguno de realidad mental; por contra, se basan únicamente en juicios de aceptabilidad lingüística de las palabras en contexto. Pero no debe pasar desapercibido el hecho de que el análisis de la meronimia de Cruse recoge los realizados en el campo de la psicolingüística anteriormente por Chaffin y Herrmann (1984), y simultáneamente por Winston et al. (1987); mientras este último, a su vez, se apoya ampliamente en el de análisis lingüístico de Cruse. Como tampoco que la aproximación de Winston et al. se enmarca en el modelo de la memoria léxica desarrollado por Miller y Johnson-Laird (1976); mientras que, ya en el campo de la representación computacional, WordNet, una base de datos que proclama basarse en principios psicolingüísticos -desarrollada por el equipo del propio Miller (Miller et al., 1990)-, utiliza para la definición de las relaciones léxicas, entre otros, los análisis lingüísticos de Cruse. Finalmente, una base de datos léxico-relacional que no prentende ser un modelo psicolingüístico sino puramente lingüístico, EuroWordNet, se fundamenta tanto en el trabajo lingüístico de Lyons y Cruse como en el piscolingüístico de Miller y Winston et al. (cf. Alonge et al., 1996; Climent et al., 1996).

    Como puede verse, en el campo de la semántica léxico-relacional, los modelos puramente lingüísticos y los psicolingüísticos se entrecruzan e incluso se solapan, nutriéndose los unos de los otros hasta formar, prácticamente, un cuerpo teórico único. Esta situación no debe resultarnos extraña, sino que por el contrario resulta habitual en lingüística. El lenguaje es una manifestación privilegiada de las facultades cognitivas del hombre; quizá, incluso, una de dichas facultades cognitivas; pero en todo caso, lenguaje y cognición humana son realidades inseparables. Por ello, no debe resultar en modo alguno insólito que descripciones lingüísticas y modelos psicolingüísticos guarden paralelismos e interaccionen entre sí.

    Los dos modelos principales de organización de la memoria léxico-conceptual son, según Saint-Dizier y Viegas (1995), el de Collins y Quillian (1972) y el antes citado de Miller y Johnson-Laird (1976). En la representación de Collins y Quillian la memoria léxica se estructura en forma de grafo, es decir, de nodos (conceptos) conectados por relaciones binarias de tipo lógico o asociativo ('y', 'o', ...). Dicha estructura se basa en el principio de economía organizativa, no previendo, pues, la existencia de redundancias en cuanto a conexiones y almacenamiento de la información, por lo que dicho modelo se ha visto invalidado a la luz de posteriores avances en el campo de la neurolingüística (p.e. vid. Damasio y Damasio, 1992) que parecen demostrar que la organización de la memoria no se rige por el principio de economía sino por el de eficiencia, con multiplicidad de conexiones y redundancias que permiten un acceso flexible a la información.

    El modelo de Miller y Johnson-Laird es compatible con la redundancia y la diversidad organizativa (cf. Miller et al., 1990). En su aproximación (ver fig. II.2) los conceptos son estructuras que median entre esquemas perceptuales, etiquetas léxicas e información gramatical asociada a estas últimas. Los esquemas perceptuales incluyen información sobre las características distintivas de los objetos (forma, color, dimensión, etc.) -extraídas a partir de la percepción y luego esquematizadas-, información funcional y posiblemente otros tipos de información mnésica. El significado de los conceptos se deriva en dicho modelo de las diferentes relaciones (Es-Un, Parte-De, ...) que establecen con otros conceptos. Las aproximaciones léxico-relacionales que, por lo que refiere a las relaciones parte-todo, describiré en este capítulo, se enmarcan dentro de este modelo.
 


Fig. II.2: Modelo de organización de la memoria de Miller y Johnson-Laird
 

    Las aproximaciones que trataré en la segunda parte de este capítulo, y que denomino constructivistas, difieren de las anteriores en que no se ciñen, como mínimo no de forma estricta, al estudio del significado en su vertiente puramente lexicalizada -en el que, de modo más o menos tácito, se toman a las unidades léxicas como punto de partida del análisis semántico-, sino que centran su estudio en las categorías mentales que, según se postula, subyacen al conocimiento lingüístico. En este tipo de aproximaciones no se aborda el conocimiento parte-todo como una mera relación paradigmática entre unidades léxicas. Por una parte, la corriente cognitivista considera que dicho conocimiento es uno de los mecanismos fundamentales que dan lugar a la formación de las categorías mentales (que ulteriormente serán expresadas mediante unidades lingüísticas). A partir del trabajo de Rosch (p.e. 1973, 1976) se introduce en los modelos de memoria léxico-conceptual la noción de prototipo, o ejemplo típicamente representativo de un concepto o de los rasgos asociados a un concepto. Dicha aproximación supone un notable cambio de enfoque respecto al tipo de información que dota de significado a los conceptos, al establecerse relaciones de proximidad entre éstos y ejemplares prototípicos de las categorías. En ella, además, los conceptos se construyen a partir de cierto número de rasgos, siendo un tipo fundamental de ellos, como veremos, los denominados rasgos de parte.

    Por otra parte, Jackendoff postula la existencia de rasgos conceptuales extralingüísticos susceptibles de dar cuenta de realizaciones lingüísticas en las que se ven implicados modos ciertamente sutiles de inclusión parte-todo -como la relación unidad-pluralidad, la relación entre una entidad y sus límites, o la relación entre una entidad y la sustancia que la conforma-. En el modelo de Jackendoff (p.e. 1992) no existe un componente léxico propiamente dicho, sino que se postula que el lexicón se halla distribuido en las reglas de correspondencia entre módulos mentales, p.e. entre las reglas que relacionan estructuras fonológicas y estructuras sintácticas; y entre estructuras sintácticas y estructuras conceptuales (ver Fig. II.3). Siguiendo la línea generativista, Jackendoff concibe la mente como una estructura modular secuencial, en la que cada módulo (p.e. fonológico, sintáctico, conceptual) recibe un input de un módulo previo y genera un output al módulo siguiente.

    Al igual que el modelo de Collins y Quillian, la estructura modular de la mente parece haber sido desmentida por los más recientes descubrimientos en materia de funciones corticales que, como he apuntado antes, sugieren una estructura en forma de red distribuida con múltiples interconexiones e interacciones entre todo tipo de nodos informativos. Sin embargo, el análisis de Jackendoff (1991) relativo a diversos aspectos de la información parte-todo es, como veremos posteriormente, susceptible de ofrecer explicación a diversos problemas de tratamiento del lenguaje, como por ejemplo el que desarrollaré en §7, las restricciones de selección de los nombres partitivos.
 


Fig. II.3: Modelo de la organización de la memoria de Jackendoff
 

    A pesar de las diferencias teóricas entre los diferentes modelos, a efectos de representación computacional del conocimiento léxico, las nociones de concepto lexicalizado que manejan todos ellos son igualmente representables en bases de representación del conocimiento. Resulta hasta cierto punto irrelevante desde el punto de vista de la formalización que el significado se defina en el modelo de Miller y Johnson-Laird mediante relaciones, y en el modelo cognitivista mediante rasgos, dado que, en una base de datos léxica, los rasgos pueden ser vistos como etiquetas de relación, y las relaciones como nombres para los rasgos. Tomemos por ejemplo los conceptos lexicalizados 'ave' y 'ala'. En WordNet -formalismo directamente basado en el modelo de Miller y Johnson-Laird- hallaríamos la representación parcial esquematizada a la izquierda de Fig. II.4; por otra parte, una representación basada en rasgos -como la utilizada en LKB (Copestake, 1992), formalismo que describiré y utilizaré más adelante- tomaría la forma que puede verse a la derecha de la misma figura. Como puede observarse, salvando divergencias teóricas, desde el punto de vista de cantidad de información representada y contenido de la misma, ambas representaciones son perfectamente equivalentes.

    En cuanto al modelo de Jackendoff, los elementos explicativos que en el mismo aparecen como primitivas conceptuales son, a pesar de enmarcarse en un modelo cognitivo totalmente dispar, igualmente representables en forma de rasgos y/o de nodos de la ontología de tipos en los formalismos de representación del conocimiento léxico y, en definitiva, asumibles como parte del conocimiento que comparten los hablantes.
 


Fig. II.4: Comparación de representaciones
 

    En todo caso, y a modo de corolario de esta introducción, es preciso hacer notar las aproximaciones de uno y otro tipo, léxico-relacionales y constructivistas, no deben ser consideradas como radicalmente disjuntas, sino que tienen diversos aspectos en común que podrían dar pie a otros modos de estructuración de este capítulo. El constructivismo y la aproximación psicolingüístico-relacional comparten la postulación de realidad mental para los constructos teóricos que se proponen. En particular, tanto el cognitivismo como la psicolingüística, con diferentes matices, asumen algún tipo de organización del significado léxico en el cerebro humano en forma de red distribuida multirrelacional. En otro orden de cosas, por lo que atañe a la posibilidad de formalización del conocimiento semántico para el procesamiento del lenguaje, tanto la aproximación psicolingüística como la de Jackendoff comparten una clara orientación en dicho sentido, dado que postulan la existencia de constructos semánticos -en el primer caso relaciones, en el segundo rasgos conceptuales- codificables en formalismos de representación del conocimiento lingüístico.

    Así pues, pasaré a continuación a describir en primer lugar en §2.1 las aproximaciones léxico-relacionales en lo que refieren al conocimiento parte-todo; y en segundo lugar en §2.2 veremos las aproximaciones constructivistas.

2.1 Enfoques léxico-relacionales: la meronimia.


2.1.1 Lyons
2.1.2 El enfoque psicolingüístico
2.1.3 Cruse
2.1.4 Recapitulación



    En esta sección describiré el enfoque léxico-relacional del fenómeno parte-todo, que comprende los problemas de la propia naturaleza de las relaciones de este tipo, su definición, sus clases, y el problema de la transitividad entre ellas. Examinaremos sucesivamente el análisis de Lyons, el psicolingüístico, y el de Cruse, para finalizar con una recapitulación de los aspectos más relevantes de todos ellos.

2.1.1 Lyons

    El primer trabajo relevante al respecto es el de Lyons (1977), quien parte de la concepción saussureana de la lengua como una estructura relacional, en el que las unidades lingüísticas (sonidos, palabras, significados) son tomadas como puntos de un sistema o red de relaciones. En dicho modelo, los constructos postulados para el análisis del lenguaje derivan de su mutua relación con otras unidades del mismo sistema lingüístico. Desde este punto de vista, se considera que una de las relaciones que estructura el léxico es la relación parte-todo.

    En primer lugar debe constatarse que no ofrece Lyons una definición formal de la relación parte-todo, aunque sí asume que la misma,

    "tal como se aprecia en los referentes de las expresiones [es] una relación establecida entre los componentes separados o separables de una cosa y la cosa entera de la que son componentes." (Lyons,1977)

    El principal objetivo del análisis de Lyons es dilucidar si la relación parte-todo es, como la hiponimia, transitiva; y apunta de entrada que el desacuerdo que dicha cuestión suscita indica de inmediato que

    "en la lengua existen diversos tipos de relaciones parte-todo." (op.cit.)

    Para el autor debe distinguirse, respecto a la transitividad, entre la que se establece en el vocabulario y la que se establece en el mundo, apreciando que

    "el hecho de que una entidad pueda describirse como parte de otra no implica, sin embargo, que se establezca una relación parte-todo entre los lexemas del vocabulario que se emplean para aludir a estas entidades." (op.cit.)

    Su conclusión al respecto es que mientras en el mundo, por lo que refiere a entidades físicamente discretas y a puntos o zonas del espacio-tiempo, tal relación es transitiva (en su ejemplo, si una empuñadura es parte de una puerta y una puerta lo es de una casa, una empuñadura es parte de una casa), en el lenguaje las relaciones parte-todo no necesariamente son transitivas: pueden serlo, pero no todas lo son, lo que deduce de la no aceptabilidad de frases como (1c) a pesar de la aceptabilidad de (1a,b):

                       (1) a. la empuñadura de la puerta
                        b. la puerta de la casa
                        c. * la empuñadura de la casa

    Lyons constata asimismo que es difícil diferenciar entre meronimia e hiponimia en el caso de relaciones léxicas en las que se ven implicadas palabras que no sean nombres cuantificables que denoten objetos discretos, p.e. nombres de masa o sustancia ('oro'), abstractos ('honradez'), o colectivos ('ganado'); o verbos que denotan actividades ('coser'). Así, 'oro' puede ser visto como un tipo de 'sustancia' o una parte de 'sustancia' ('esta sustancia contiene oro' frente a 'esta sustancia es oro'); 'honradez' como un tipo o una parte de 'virtud'; 'hilvanar' como un tipo o una parte (un subevento) de 'coser'; 'vaca' como un tipo o una parte de 'ganado'. Respecto a éste último caso, hace notar que, por contra, no es posible postular relación de hiponimia, y sí sólo de meronimia, entre 'oveja' y 'rebaño'. La razón recaería para Lyons en que los nombres de grupo, como 'rebaño', a diferencia de los colectivos como 'ganado', tienen una función individualizadora, similar a la de 'estanque' en relación a 'agua': 'rebaño' individualiza un conjunto respecto a individuales indiferenciados ('ovejas') de la misma forma que 'estanque' individualiza una cantidad de una sustancia ('agua').
 

2.1.2 El enfoque psicolingüístico.

    El equipo encabezado por Chaffin y Herrmann desarrolla a partir de las consideraciones de Lyons un marco explicativo de las relaciones meronímicas fundamentado en la experimentación psicolingüística. En dicho marco se trata las relaciones ya no simplemente como un medio para estructurar el léxico de una lengua sino además como entidades con realidad psicológica que constituyen el armazón de la memoria semántica de los hablantes, los cuales incluirían dentro de su competencia lingüística las capacidades de comparar, identificar y producir de forma creativa relaciones semánticas.

    La aproximación más relevante en dicho marco es la de Winston et al. (1987), que tiene su antecedente en el de Transue (1982), quien clasificó 31 términos que ocurren en el esquema "A es un X de B", agrupándolos en las cinco categorías mayores reflejadas en la tabla II.1.

    Tomando dicho trabajo en consideración, Winston et al. (1987) desarrollan su propio análisis de las relaciones léxicas parte-todo, llegando a las siguientes conlusiones generales:

    · la meronimia no es una relación sencilla sino una familia de relaciones
    · la meronimia es una clase de relaciones distinta de la inclusión espacial y de la inclusión entre clases
    · la transitividad no se propaga a través de tipos diferentes de relación meronímica.


Tabla II.1: Esquemas 'A es un X de B'

       En cuanto a la transitividad de la inclusión meronímica, los autores postulan la hipótesis de que, existiendo diversos tipos de meronimia, no puede darse la transitividad que implique tipos diferentes. Esta hipótesis da cuenta de las aparentes paradojas señaladas por Lyons (1977) y Cruse (1979) (cf. Iris et al., 1988). Así, la no aceptabilidad de (2c) se explicará por el hecho de que (2a) y (2b) son instancias de diferentes tipos de meronimia (respectivamente, Componente-Objeto y Miembro-Colección).

    (2) a. El dedo de Simpson es parte de Simpson
    b. Simpson es parte del Departamento de Filosofía
    c. *El dedo de Simpson es parte del Departamento de Filosofía

    Los tipos de relaciones meronímicas que Winston et al. (1987) postulan son los de la tabla II.2:
 

    Relación

    Ejemplo

    componente - objeto

    pedal - bicicleta

    miembro - colección

    barco - flota

    porción - masa

    rebanada - pan

    material - objeto

    acero - coche

    fase - actividad

    pagar - comprar

    lugar - área

    oasis - desierto

Tabla II.2: Modelo de Winston et al. (1987)

    Asimismo desarrollan la teoría (Teoría de los Elementos Relacionales) de que cada tipo de meronimia no es en sí una entidad unitaria o primitiva, sino que pueden ser descompuestas -y definidas- a partir de tres elementos de significado de orden más básico, o rasgos semánticos booleanos: ±Funcional, ±Homómero, y ±Separable. Las definiciones que ofrecen para dichos rasgos son las siguientes:

    · Funcional: las partes están o no en una posición espacial/temporal específica con respecto a las demás [partes del todo] , lo que sirve de base a su rol funcional con respecto al todo
    · Homómero: las partes son similares o no en naturaleza respecto a las demás [partes] y respecto al todo al que pertencen
    · Separable: las partes pueden o no ser, en principio, separadas físicamente del todo al que están unidas

    La combinación de dicho trío de pares de rasgos (o elementos relacionales) caracteriza cada tipo de meronimia, del siguiente modo:

    · Componente-Objeto +F -H +S
    · Miembro-Colección -F -H +S
    · Porción-Masa -F +H +S
    · Material-Objeto -F -H -S
    · Fase-Actividad +F -H -S
    · Lugar-Área -F +H -S

    Dichas tesis fueron desarrolladas posteriormente por Chaffin y Herrmann (1988), abundando en la idea de que las relaciones son conceptos abstractos compuestos de elementos relacionales, los cuales gozarían de entidad psicológica real -según demostraría la experimentación psicolingüística llevada a cabo por los autores-.

    Los elementos relacionales dan cuenta para Chaffin y Herrmann de las características de las relaciones meronímicas y de la capacidad del hablante para emitir juicios al respecto: cuántos más elementos compartan dos relaciones, más similares serán éstas entre sí. En un experimento previo (Chaffin y Herrmann, 1984) se ofreció a un grupo de sujetos un listado de 31 relaciones ejemplificadas mediante cinco pares de palabras cada uno, a fin de que las clasificaran de acuerdo con la similitud o disimilitud que juzgaran existían entre ellas. El resultado fue una jerarquía de similitud de relaciones, las cuales resultaron agrupadas en los cinco grupos mayores siguientes: Contrastes ('vivo'-'muerto'), Inclusión de Clase ('animal'-'caballo'), Similares ('coche'-'auto'), Casos ('pintor'-'pintar') y Parte-Todo ('coche'-'motor').

    Cada relación se definió mediante rasgos distintivos (tomados del trabajo de Stasio et al., 1985, quién a su vez las extrajo de diversas fuentes bibliográficas de los terrenos de la lingüística y la psicología). Para la familia parte-todo, los rasgos -o elementos relacionales- relevantes son:

    PR (Propiedad): Palabra2 es una propiedad de Palabra1
    PO (Posesión): P1 posee una propiedad o atributo
    A ('attachment' Conexión): P2 está conexa a P1
    H (Homogéneo): Las P2 son intercambiables
    S (Social): P2 es parte de P1 por acuerdo social
    L (Inclusión Locativa): P2 está "en" P1

    De acuerdo con dichos rasgos se clasificaron las relaciones parte-todo como un subconjunto de siete relaciones (de entre las 31 relaciones semánticas clasificadas), definidas y ejemplificadas del siguiente modo:

    · Objeto Funcional (árbol-hoja) PR, PO, A, C
    · Colección (bosque-árbol) PR, PO, H
    · Grupo (coro-cantante) PR, PO, H, S
    · Ingrediente (pizza-queso) PR, PO, L, C
    · Localización Funcional (dormitorio-cama) PR, PO, A, C
    · Organización (ejército-batallón) PR, PO, A, C, S
    · Medida (hora-minuto) H

    En un segundo estudio, la familia de relaciones parte-todo y similares fue afinada y detallada, resultando la clasificación reflejada en la tabla II.3.


Tabla II.3: Relaciones parte-todo en Chaffin y Herrmann (1988)
 

    Como se ha apuntado, dicho haz de relaciones se ordenó de forma jerárquica de acuerdo con la proximidad entre ellas (de acuerdo con la percepción de los sujetos del experimento). Los resultados más destacables de dicha ordenación son: (a) se percibe que el mayor grado de diferencia es el existente entre el grupo de relaciones de Material y el resto de relaciones; (b) de entre el resto de relaciones (todas excepto Material), el mayor grado de diferencia es atribuido a la relación Masa-Porción (ver fig. II.5).
 


Fig. II.5: Percepción de diferencias fundamentales entre relaciones de parte y
similares según los experimentos de Chaffin y Herrmann (1988)
 

    Hasta aquí hemos visto las líneas fundamentales de la aproximación psicolingüística. A continuación examinaremos la de Cruse (1986), que toma algunos aspectos de la misma y la extiende a partir de criterios más estrictamente lingüísticos.
 

2.1.3 Cruse

    Cruse (1986), al igual que Lyons, parte del axioma de que el significado de las unidades léxicas se refleja necesariamente en esquemas de comportamiento lingüístico; es decir, en juicios de normalidad o anormalidad aplicados al uso de tipos coherentes de palabras en contextos determinados, los cuales se toman como paradigmas reveladores de las propiedades léxico-semánticas. Por ejemplo, la posible relación de hiponimia entre 'oveja' y 'animal' o 'planta' vendrá determinada canónicamente por la normalidad o anormalidad de su uso en la expresión 'un/a X es un/a Y' ('una oveja es un animal', '*un animal es una oveja', '*una oveja es una planta').

    Para Cruse la meronimia es el segundo tipo principal de jerarquía léxica ramificante -tras la hiponimia-, y admite la plausibilidad de la hipótesis antropocentrista (ver más abajo 2.2.1) defendida por Lakoff y la corriente cognitivista, según la cual una percepción o conciencia primigenia de la estructuración parte-todo del propio cuerpo sería el detonante de la formación de una organización análoga del resto de categorías léxico-conceptuales.
 

    Relación de parte y relación de porción

    La distinción básica que hace es, dentro de la relación parte-todo que engloba a ambas, entre relación de parte ('part of') y relación de porción ('piece of'), diferencia que ilustra tomando como ejemplo una máquina de escribir. Con la ayuda de una sierra puede dividirse una máquina de escribir en un número indeterminado de trozos; sin embargo, para obtener sus partes deberá usarse un destornillador. Partes y porciones comparten las siguientes características: estabilidad topológica (no puede hablarse de una parte o una porción de vapor), continuidad espacial (una parte o una porción son entidades continuas), y relación topológica determinada de partes y porciones con sus todos y sus partes o porciones 'hermanas'. Por contra, difieren en las siguientes:

    · La relación porción-de es siempre transitiva; la parte-de no siempre lo es
    · Las partes son, en algún grado, autónomas; las porciones no (una parte de una máquina de escribir puede reemplazar a otra igual en otra máquina de escribir, o puede no haber formado parte nunca de ninguna y ser utilizada para la construcción de una máquina de escribir de nuevo cuño; pero un trozo de una máquina de escribir no será trozo de otra ni podrá usarse para la construcción de una de nueva)
    · Los límites de las porciones son arbitrarios, los de las partes no
    · Una parte tiene una función determinada con respecto al todo, una porción no.

    Esta última característica, la funcionalidad, es especialmente importante dado que es capaz de delimitar 'partes' sin que exista discontinuidad con el todo, p.e. 'la punta de la lengua' ('the tip of the tongue') deberá ser considerada 'parte' y no 'porción' en tanto tiene una funcionalidad definida.

    Asimismo, para Cruse la relación de porción no cristaliza en niveles léxicos debido a que las porciones no pueden ser agrupadas en subclases debido a la falta de una suficiente constancia de atributos.
 

    Definir la meronimia.

    Hasta aquí las consideraciones de Cruse no han sido de tipo lingüístico sino general. A partir de ellas, pasa al terreno estrictamente lingüístico. Una primera definición provisional de meronimia es:

    "the semantic relation between a lexical item denoting a part and that denoting the corresponding whole"

    ["la relación semántica entre un lexema que denota una parte y otro que denota el correspondiente todo"]  

(Cruse, 1986)

    A partir de ella debemos hacer notar dos cosas:

    (i) que la meronimia no incluye la relación de porción, sino únicamente la de parte;
    (ii) que no necesariamente toda relación de parte es meronímica -únicamente si dicha relación está lexicalizada-.

    La definición formal básica (que deberá ser ulteriormente precisada) de meronimia es, para el autor, la siguiente:

    X es un merónimo de Y si y sólo si oraciones de la forma "un Y tiene Xs / un Y tiene un X" y "un X es parte de un Y" son normales cuando las frases nominales "un X", "un Y" son interpretadas genéricamente.

    Así, para que exista meronimia debe poder juzgarse normalidad en ambos supuestos posibles ('un cuerpo tiene brazos' y 'un brazo es parte de un cuerpo'; pero nótese que: 'un hijo tiene una madre' / '*una madre es parte de un hijo').

    Hemos dicho que la anterior definición formal es la básica, sin embargo no la definitiva pues no cubre todo tipo de meronimias: por ejemplo, aunque 'sépalo' parece que debe ser considerado merónimo de 'flor', Cruse no juzga normal la oración '?una flor tiene sépalos' (debido a que no todas las flores tienen sépalos). En consecuencia, propone incluir un nuevo 'test' que permita aceptar como meronímica la relación 'sépalo'-'flor' y otras (que trataremos a continuación) que no tienen cabida en la definición básica:

    las partes de un Y incluyen el X/los Xs, el Z/los Zs, etc.

    Para el autor, la existencia de meronimias que no superan el test fundamental corrobora la tesis ya anteriormente formulada de que existen no una, sino una multiplicidad de relaciones meronímicas, las cuáles se deben a diversos factores, que trataremos más adelante.
 

    Transitividad de la meronimia

    Los principios más generales postulados por Cruse respecto a la transitividad de las relaciones parte-todo son:

    · La relación 'porción de' es inequívocamente transitiva (una porción de una porción de un todo es una porción del todo, p.e., un trozo de un trozo de pan es un trozo de pan); sin embargo, en la relación 'parte de' -lingüísticamente, la meronimia- deben cumplirse ciertas condiciones.
    · La condición principal que se debe cumplir para que una jerarquía meronímica sea transitiva es que, dado que existen muy diversos tipos de meronimia, la transitividad sólo existirá si la relación se mantiene dentro del mismo tipo (excepto, como veremos, en el caso de las 'partes unidas'). Este principio se formula únicamente de forma genérica, admitiendo el autor que es difícil de articular en muchos casos; sin embargo sí es útil para descartar relaciones obviamente mal formadas del tipo 'el dedo de Simpson es parte de Simpson; Simpson es parte del Departamento de Filosofía, luego el dedo de Simpson es parte del Departamento de Filosofía'.

    En relación con los ejemplos típicos de Lyons (1977) de existencia ('puño'® 'manga'® 'chaqueta') o inexistencia ('empuñadura'® 'puerta'® 'casa') de la transitividad, Cruse atribuye el segundo supuesto a tres tipos de factores.

    Por una parte, postula que la transitividad no se mantiene en el caso de las 'partes unidas', y sí en el de las 'integrales.' Así, siendo 'dedo' parte unida de 'mano' y 'mano' de 'brazo', será dudoso afirmar que '?un dedo es parte de un brazo'; pero sí podrá decirse que 'una rótula es parte de una pierna' ya que 'rótula' es parte integral de 'rodilla' y 'rodilla' lo es de 'pierna'. En los ejemplos de Lyons (1977), no se producirá la transitividad entre 'empuñadura' y 'casa' y sí entre 'puño' y 'chaqueta' por las mismas razones.

    Otro factor que determina la no aceptabilidad de 'una empuñadura es parte de una casa' es el de la polisemia lógica (en la terminología de Cruse, la subyacencia de un espectro de sentidos) de 'empuñadura': dado que el término es susceptible de referir a una gama diversa de objetos, aún cuando pudiera concebirse una casa con empuñadura (p.e. en el caso de una casa de juguete), dicho sentido -aunque estrechamente relacionado con el mismo- no sería exactamente el atribuible a 'la empuñadura de una casa'.

    Finalmente, '*una empuñadura es parte de una casa' tampoco es aceptable a causa de lo que Cruse denomina dominio funcional. Considera que las partes tienen típicamente una función más o menos determinada con respecto al todo; y en el caso que nos ocupa no es imaginable la función de una 'empuñadura' con respecto a una 'casa' (excepto en el supuesto de una casa de juguete). En cambio 'puño' sí tiene una función con respecto a 'chaqueta' -la misma que con respecto a 'manga', una función básicamente decorativa-, por lo que sí es aceptable la expresión 'el puño de una chaqueta'.
   

    Diferencias y similitudes entre taxonomías y meronimias.

    Para el autor ambos tipos de jerarquías léxicas, fundamentalmente y aparte de otras consideraciones marginales, se asemejan en que parecen responder a un mismo principio subyacente de subdivisión, y se diferencian en cómo se relacionan con los hechos extra-lingüísticos, pues las meronimias parecen estar más directamente relacionadas que las taxonomías con la realidad.

    Ambas, taxonomías y meronimias, implican para Cruse una especie de relación de inclusión por lo que parecen ser manifestaciones alternativas de un mismo principio: la subdivisión. Cada una de ellas daría cuenta de dicho principio atendiendo a un parámetro diferente. La taxonomía lo haría desde el punto de vista de la distintividad externa, es decir, basándose en el grado de similitud o disimilitud entre entidades por causa de atributos compartidos y no compartidos. La meronimia, por su parte, atendería al factor de cohesión interna de las entidades, es decir, a la oposición entre integridad física y desconexión. La consecuencia más directa de la similitud/disimilitud entre una y otra relación es que una taxonomía puede ser descrita como una relación parte-todo, pero no al revés.

    Por lo que respecta a las diferencias, para Cruse la fundamental es que 'la taxonomía es una jerarquía de clases y la meronimia una clase de jerarquías'. La meronimia trata de la estructuración de las partes (individuales) de cada entidad (individual), por tanto, como relación, es una clasificación de un haz de jerarquías (p.e., de todas las relaciones cabeza-cuerpo detectables en el conjunto de los cuerpos). Advierte sin embargo, que ello no debe hacer presuponer que la meronimia es puramente un asunto de la realidad, sino que es primordialmente léxico-semántico (como es de observar a partir de los diversos fenómenos antes relatados de facultatividad, espectros de sentidos, etc.) ya que se fundamenta no en la realidad en sí sino en la atribución de etiquetas léxicas a partes o grupos de atributos de la realidad.
   

    Tipos de meronimia: Meronimias Central y Periférica

    La distinción básica que sienta Cruse es entre el tipo de meronimia que considera central y los tipos periféricos o cuasi-meronímicos. La primera es la relación existente entre partes y todos de entidades físicas cohesionadas y tangibles; la segunda clase incluye relaciones entre nociones tales como colectividades, entidades abstractas, masas, etc. Ambos tipos se abordan por separado y dentro del tipo central se tienen en cuenta dos tipos de factores: en primer lugar factores de interferencia de niveles; y en segundo los diversos tipos de cohesión parte-todo -a fin de seguir la descripción, véase a continuación la tabla II.4-.

    I. Meronima central: entidades fisicas. Diversos factores diferenciales motivan la existencia de diversos tipos entrelazados de relación meronímica (incluso dentro del propio tipo central). El primer paquete de factores tiene que ver fundamentalmente con el hecho de que las taxonomías meronímicas no muestran una organización clara en niveles coherentes sino diversos grados de interferencia y solapamiento entre ellos. Describiremos en primer lugar dicho haz de factores, y a continuación otros dos relativos el tipo de cohesión existente entre las partes de las entidades.

    Factores de interferencia de niveles en el tipo central de meronimia. Un grupo de cuatro factores: opcionalidad, congruencia, espectro de sentidos y holo-meronimia, es la causa de que diversas relaciones parte-de no superen, o lo hagan de forma dudosa, los tests de meronimia estricta que sirven de definición de la relación. Los describiré someramente a continuación.


Tabla II.4: Clasificación de los tipos de meronimia según Cruse (1986)

 
    (a).- Posible opcionalidad de la relación.

    Este criterio contempla el hecho de que una parte lo sea de un todo (o un todo tenga a algo por parte) de forma necesaria, o bien de forma opcional. Así, una flor, opcionalmente -pero no necesariamente- tiene sépalos; y ello es lo que invalida la expresión '?una flor tiene sépalos', pero no 'un sépalo es parte de una flor'.

    La combinación de las condiciones de opcionalidad y obligatoriedad en cualquiera de los dos sentidos de la relación ('X es merónimo de Y', 'Y es holónimo de X') da lugar a cuatro tipos de meronimia:

    (a1).- canónica/canónica (p.e. 'brazo'-'mano', pues una mano es necesariamente parte de un brazo y un brazo necesariamente tiene una mano)

    (a2).- facultativa/facultativa (p.e. 'universidad'-'museo', dado que un museo puede ser parte de una universidad y una universidad puede tener por parte a un museo, pero no necesariamente un museo es parte de una universidad ni una universidad tiene por parte a un museo)

    (a3).- facultativa/canónica (p.e. 'editorial'-'periódico': un periódico no necesariamente tiene editorial -en el sentido de artículo de opinión, no de empresa editora-, pero un editorial es necesariamente parte de un periódico). Otro ejemplo sería 'tejado'-'casa': no todas las casas tienen tejado, pero un tejado siempre lo es de una casa.

    (a4).- canónica/facultativa (p.e. 'líquen'-'hongo', ya que al parecer un líquen necesariamente tiene por parte a un hongo, pero un hongo puede tener existencia autónoma y no necesariamente es parte de un líquen).

    (b).- Congruencia.

    Este factor es parecido al de la opcionalidad de la relación pero no idéntico a él. La diferencia se halla en que en el caso de la opcionalidad se considera que cualquier ejemplar del holónimo puede o no estar en relación con el merónimo, o viceversa (p.e., cualquier periódico puede tener o no editorial); sin embargo en el que nos ocupa ahora la opcionalidad no es libre sino condicionada a un subtipo específico (p.e. no cualquier flor puede o no tener sépalos, sino que ciertas flores necesariamente los tienen y otras necesariamente no los tienen).

    Esta característica da lugar básicamente a dos tipos de holonimia/meronimia: aquél en que el merónimo es más general que el holónimo (p.e. 'nail' ('uña'), en relación a 'finger' ('dedo de la mano') y 'toe' ('dedo del pie'), puesto que 'nail' es merónimo tanto de uno como de otro pero no de forma indiscriminada, las uñas de los dedos de las manos son diferentes de las de los dedos del pie; y aquél en que el holónimo es más general que el merónimo (p.e. 'flor'-'sépalo' y 'cuerpo'- 'útero', dado que un cuerpo tiene o no útero dependiendo de si es femenino o masculino).

    La terminología utilizada por Cruse al respecto es la siguiente: 'dedo' es super-merónimo de 'mano' y 'pie', y éstos son hipo-holónimos de 'dedo'; 'cuerpo' es super-holónimo de 'útero', y éste hipo-merónimo de 'cuerpo'.

    (c).- Espectro de sentidos relacionados.

    Es el caso del típico ejemplo de Lyons (1977) 'puerta'-'empuñadura' ('door'-'handle'). Este factor hace que sea dudoso afirmar que '?a handle is a part of a door', pero no que 'a door has a handle'. 'Handle' debería considerarse un super-merónimo de 'door', dado que puede hablarse de 'handles' de puertas, de cajones y de cucharas; pero considera Cruse que, de forma más precisa, lo que ocurre es que existen varios sentidos para 'handle' estrechamente relacionados, uno de los cuales sería [empuñadura de puerta], otro [empuñadora de cajón] y otro [mango de cuchara].

    (d).- Holo-meronimia.

    Se da cuando un término puede denotar alternativamente la parte de un todo, o el todo en sí. Es el caso de 'blade' (aproximadamente, 'brizna', u 'hoja' en sentido restrictivo, es decir, la hoja sin el tallo), que puede ser merónimo de 'leaf' ('hoja') si la hoja tiene tallo, o denotar la hoja entera si no lo tiene. Un ejemplo en castellano de holo-meronimia es la relación existente entre 'piso' y 'casa' -en su sentido de [morada, lugar donde uno vive]-: un piso puede ser una parte de la casa (si ésta tiene planta baja y piso/s) o toda la casa en sí.

    Diferentes tipos de cohesión parte-todo en el tipo central de meronimia. Cruse expone dos tipos de oposición que tienen que ver con formas divergentes de integración de la parte en el todo:

    (a).- Partes unidas vs. partes integradas.

    El ejemplo prototípico de dicha diferenciación es la existente entre 'palma' y 'dedo' respecto a 'mano'. La palma es una parte integrada, no separable, de la mano: no puede concebirse una mano sin palma y las expresiones '*una mano sin palma' o '*la palma está unida a la mano' no son admisibles. El dedo, sin embargo, es separable de la mano: una mano es concebible aunque le falte algún dedo, y las expresiones 'una mano sin dedos' o 'el dedo está unido a la mano' son aceptables. La noción fundamental subyacente a esta distinción es que un todo no queda destruido si le falta una 'parte unida', y sí si le falta una 'parte integral'.

    (b).- Partes sistémicas vs. partes segmentales.

    Tomando nuevamente como ejemplo el cuerpo humano, consideraremos que 'cabeza', 'brazos', etc. son partes segmentales y 'nervios', 'músculos', 'arterias' etc. partes sistémicas. Las primeras están dispuestas de modo secuencial, se desarrollan a lo largo de los ejes espaciales mayores de un todo y muestran un mayor grado de cohesión espacial; las segundas son topológicamente interpenetrantes y muestran una mayor unidad funcional y de constitución que las primeras. Apunta Cruse que el lenguaje ordinario tiene mayor preferencia por dividir un todo en partes segmentales.

    II. Clases no centrales de meronimia. Describe Cruse una pléyade de relaciones parte-todo que, aunque no considera sean en sentido estricto meronimias, sí pueden ser vistas como cercanas o similares a ella. Son las siguientes:

    (a).- Lugares incluídos en los límites de otros lugares, como p.e. Francia:Europa. Considera que son más 'porciones' que 'partes', como demuestra la inaceptabilidad de '*Europa tiene Francia', y deben tomarse más como aspectos terminológicos peculiares que como relaciones parte-todo. Sin embargo, añade, ello no es tan claro en una relación del tipo capital:país, ya que sí es aceptable 'un país tiene una capital'.

    (b).- Partes de entidades con estructura temporal, como 'strip-tease:show', 'movimiento:sinfonía'. Todo suceso que tenga una duración en el tiempo es susceptible de ser dividido en partes, denominadas 'estadios' o 'fases'. Como en el caso de las entidades, pueden ser segmentales (caso de 'movimiento'-'sinfonía') o sistémicas ('strip_tease'-'show').Tambien pueden considerarse relaciones de orden más periférico como partes de estados ('autocontrol'-'madurez', 'el autocontrol es parte de la madurez') o rasgos típicos de eventos ('calor'-'verano', 'el calor es parte del verano').

    (c).- Medidas, como 'gramo'-'kilo'. Cruse no considera esta relación como estrictamente meronímica por no ser ramificante. La característica principal es la total falta de diferenciación entre las partes (un gramo es exactamente igual a otro gramo)

    (d) Colectividades, como 'tribu', 'clero', 'bosque' o 'rebaño'. Este tipo de entidades está menos integrado estructuralmente que los objetos, y sus partes son todos independientes -y a menudo indiferenciados- de un tipo más básico. Distingue Cruse entre cuatro tipos de relaciones colectividad-miembro:
 

    (d.1).- Grupo-Miembro, como en 'tribu', 'equipo', 'comité', 'familia', 'orquesta' o 'público'. Parecen restringidos a asociaciones de humanos y suelen designar un propósito o función común de la colectividad. En algunos casos existen nombres específicos para los elementos del grupo ('músico', 'senador'). Se caracterizan morfosintácticamente en inglés por admitir el plural ('teams' -'equipos'-) y poder concordar con el verbo indistintamente en singular o plural ('the team is/are under investigation').

    (d.2).- Clase-Miembro, como en las relaciones 'proletariado'-'trabajador', 'clero'-'obispo' o 'aristocracia'-'duque'. En este caso la agrupación está justificada más por atributos comunes que por la función de la colectividad; es orgánicamente menos cohesiva que un grupo y sus miembros son menos claramente partes que los elementos de grupos. Morfosintácticamente, parecen rechazar el plural (?'aristocracies') y prefieren la concordancia en plural ('the aristocracy were/?was unhappy').

    (d.3).- Colección-Miembro, como en 'bosque'-'árbol', 'montón'-'piedra' o 'biblioteca' (en el sentido de colección, no de lugar)-'libro'. Son típicamente agrupaciones de objetos inanimados. La relación de miembro a colección suele ser facultativa y la inversa necesaria (un árbol no tiene por qué ser parte de un bosque, pero un bosque está formado por árboles). Los nombres de colección son pluralizables ('forests' -'bosques'-), pero si están en singular no pueden concordar con el verbo en plural ('the forest is/*are necessary')

    (d.4).- Grupo de Animales-Animal ('rebaño', 'piara'). Para Cruse esta relación es intuitivamente diferente de la de grupos de humanos ya que el nombre de la agrupación comparte propiedades morfosintácticas de las relaciones de Grupo y de Colección, ya que en inglés '?the herd are...' -'el rebaño son...'- no parece aceptable, pero 'the (wolf) pack have...' -'la jauría (de lobos) han...'- sí lo es.

    (e).- Ingredientes o constituyentes ('acero'-'coche', 'café'-'café con leche'). Se caracterizan porque la parte es un nombre de masa, y refiere a sustancias usadas en la preparación del todo o que forman parte de su composición.

    (f). Partículas de sustancias ('grano'-'arena'). En este caso el nombre de masa es el todo, mientras que la parte es contable. Sucede cuando el todo es una sustancia que, examinada con detalle, resulta estar compuesta de partículas.

    Hasta aquí hemos visto el análisis de la meronimia hecho por Cruse. Examinemos en la sección siguiente cuáles son las líneas generales de las aproximaciones relacionales en las que ésta se incluye.
 


  2.1.4 Recapitulación

    A pesar de que los autores relacionados hasta aquí siguen dos líneas distintas de definición de las relaciones meronímicas -los lingüistas, a partir de tests de aceptabilidad; los psicolingüistas, a partir de elementos conceptuales abstractos subyacentes-, todos ellos concuerdan en afirmar que no existe una sola sino una vasta familia de relaciones léxicas parte-todo. Definir las propiedades de transitividad de las mismas parece ser algo difícil de articular. Winston et al. postulan que la relación parte-todo es transitiva mientras se mantenga dentro de un mismo subtipo; sin embargo Cruse hace notar la dificultad de mantener tal aseveración en todos los casos.

    La multiplicidad de clasificaciones ofrecidas y la heterogeneidad de los factores que en ellas se manejan parece ser reflejo de la dificultad de llegar a una delimitación clara de los diferentes tipos de relaciones meronímicas. Con el paso del tiempo, la clasificación que ha adquirido mayor grado de consenso (cf. Saint-Dizier y Viegas, 1995), quizá por ser la que propone un número más reducido y general de tipos y una mayor claridad de definición de los mismos, es la de Winston et al. (1987), que repito a continuación:

    • componente / objeto integral (relación estructural y funcional clara antre el todo y las partes)
    • miembro / grupo o conjunto (no existe necesariamente relación estructural o funcional entre el todo y las partes)
    • porción / masa (similaridad estructural total entre el todo y las partes; los límites de las partes son arbitrarios; no existe relación funcional entre las partes y el todo)
    • objeto / material (describe los ingredientes o materia constitutiva de un todo)
    • fase / actividad o proceso (describe una relación parte-todo temporal)
    • lugar / área (relación parte-todo locativa; la parte no es funcional respecto al todo)

    Esta clasificación, como veremos en el capítulo siguiente, es la que sirve de base a los modelos computacionales de representación del conocimiento léxico WordNet y EuroWordNet.

    En muchos aspectos, quizá debido a su voluntad generalizante, la clasificación de Winston et al. resulta demasiado esquemática, debiendo ser tenidas en cuenta diversas apreciaciones de Cruse, de las que cabe destacar como más relevantes las siguientes:

    • Existen múltiples factores que interfieren en la tarea de establecer relaciones meronímicas unívocas y bien definidas, siendo los más destacables diversos grados de opcionalidad de las relaciones, así como, inevitablemente, los diversos grados de polisemia a que se hallan sujetos los lexemas que son términos de las mismas.

    • Desde el punto de vista lingüístico, es difícil fijar un conjunto claro y bien definido de tests de aceptabilidad que den cuenta de forma clara y discriminativa de la relación parte-todo en general y de sus diversos subtipos.

    • La relación establecida entre (nombres denotadores de) objetos físicos tangibles y sus partes estructurales son concebibles como el ejemplo central de relación meronímica, siendo los demás tipos de meronimia de orden marginal o secundario.

    • Parece necesario establecer una distinción entre relaciones meronímicas (o de parte) y relaciones de porción. Para Cruse la distinción fundamental entre ambas debe hallarse en que las partes tienen una función distintiva respecto al todo, y los porciones no. Un segundo criterio a tener en cuenta es el de delimitación: los límites de las partes son motivados y los de las porciones, arbitrarios.

    • Un aspecto a ser tenido en cuenta es el de la lexicalización de las relaciones parte-todo. Para Cruse las relaciones de porción no lexicalizan y las relaciones meronímicas sí.

    Esta última afirmación, como veremos ampliamente más adelante, es discutible. Tanto la clasificación de Cruse como las diversas clasificaciones del equipo de Chaffin y Herrmann contemplan relaciones meronímicas del tipo 'grano' / 'arroz' o 'rebanada' / 'pan', las cuales no pueden ser consideradas en puridad como relaciones parte-todo lexicalizadas, sino que más bien los nombres de parte ('grano' y 'rebanada') parecen ser, más que nombres de objetos, predicados nominales susceptibles de ser aplicados, respectivamente, bien a cualquier tipo de entidad granular, bien a cualquier tipo de entidad susceptible de ser cortada en rebanadas. Por otra parte, entidades clasificables como porciones o trozos, pueden ser consideradas lexicalizadas en castellano en palabras como 'jirón' o 'mendrugo'.

2.2 Aproximaciones constructivistas
 


2.2.1 La gramática cognitiva
2.2.2 La semántica conceptual: Jackendoff



    Los análisis que presentaré en esta sección representan un notable cambio de enfoque metodológico respecto a las descritas en § 2.1, al no centrarse en relaciones estructurales sino en los principios mentales subyacentes a la creación de categorías léxicas. La gramática cognitiva, en concreto, fija su atención primordial en el proceso de categorización mental, del que, según se postula, el conocimiento parte-todo parece ser uno de los mecanismos básicos de construcción de las categorías. Asimismo se hipotetiza que los esquemas generales parte-todo emergen en los humanos a partir de una concepción experimentalista del propio cuerpo tomado como el esquema parte-todo prototípico. En § 2.2.1 presentaré el cognitivismo, finalizando con el análisis crítico de las teorías relacionales del conocimiento parte-todo -vistas en la sección anterior- realizado desde un punto de vista cognitivista por Iris et al. (1988). En dicho análisis se critica la excesiva subclasificación de las relaciones meronímicas realizada por los psicolingüistas, postulándose por el contrario un número muy reducido de esquemas merológicos básicos.

    En § 2.2.2 veremos la aproximación de Jackendoff (1991), el cual, a partir de unos hipotéticos elementos conceptuales atómicos innatos, da cuenta de aspectos íntimamente relacionados con el conocimiento parte-todo, tales como límites de entidades, pluralidad, entidades granulares constituidas internamente por elementos de un cierto tipo, o relaciones (que dan lugar a alternancias polisémicas) entre una entidad y la materia de la que está hecha. Los análisis de Jackendoff, -prescindiendo de consideraciones sobre innatismo o realidad psicológica de los elementos conceptuales que postula- resultarán, por su alto nivel explicativo, de gran utilidad para la representación formal de diversos aspectos del conocimiento lingüístico que desarrollaré en la segunda parte de este trabajo.
 
 

2.2.1 La Gramática Cognitiva

    La Gramática Cognitiva (en lo sucesivo GC) es una corriente heterogénea emparentada con el funcionalismo y la Semántica Generativa, impulsada en los últimos años por lingüistas como Lakoff, Langacker, Fillmore y Talmy entre los más destacados. Nace en cierta forma como reacción al generativismo, a partir de la negación de que la gramática sea un módulo autónomo e independiente del cerebro, un sistema innato dirigido a generar de forma algorítmica el conjunto de frases bien formadas de la lengua a partir de un conjunto universal de categorías sintácticas autodefinidas (N, V, A, P) y un sistema de reglas y operaciones sobre el orden de aparición de dichas categorías en el lenguaje. Por contrapartida, la GC postula que la capacidad lingüística es indisociable de las capacidades cognitivas generales:

    "Language, being at once both the creation of human cognition and an instrument in its service, is thus more likely than not to reflect, in its structure and functioning, more general cognitive abilities"

    ["El lenguaje, siendo al mismo tiempo una creación de la cognición humana y un instrumento a su servicio es, en consecuencia, más posible que sea que no que no sea, en su estructura y funcionamiento, un reflejo de capacidades cognitivas más generales."]

Taylor (1989)

    En dicho marco, por consiguiente, las categorías lingüísticas no son vistas como constructos mentales autónomos y autosuficientes sino como algo directamente imbricado en el conjunto de las categorías (conceptos) mediante las cuales los humanos comprenden y organizan el mundo (no lingüístico) que les rodea. Así, los lexemas no son únicamente categorías lingüísticas, sino que además son correlatos de categorías no lingüísticas: la existencia en español de las palabras 'árbol' y 'arbusto', por citar un caso, es no sólo un hecho lingüístico sino también algo inseparable de una cierta forma de organizar, en un determinado entorno sociocultural, un determinado aspecto de la realidad.

    La principal consecuencia de esta forma de enfocar el lenguaje es que la comprensión de los procesos lingüísticos pasa por la comprensión de los procesos mentales dado que, por hipótesis, los primeros no son sino un subconjunto de los segundos. A tal respecto, una parte fundamental de la investigación en GC se relaciona con las teorías de Rosch sobre categorización y la noción de prototipo como método de creación y organización de categorías mentales, por oposición a la concepción aristotélica de las clases como conjuntos definidos mediante condiciones necesarias y suficientes.

    Respecto a la relación entre categorías lingüísticas y categorías mentales es preciso apuntar que para la GC las primeras surgen de una interacción entre convención y motivación; es decir, se aparta de las posiciones extremas que suelen ser denominadas (cf. Taylor, 1989) Nominalismo y Realismo. Desde un punto de vista nominalista el significado léxico es arbitrario, un reflejo de la convención. Por contra, la perspectiva realista postula que los conceptos reflejan propiedades realmente existentes en el mundo. Así, un concepto léxico como [rojo] , surgiría para un nominalista a partir de la observación de como la palabra 'rojo' es usada en convencionalmente en castellano; por contra, para un realista, 'rojo' corresponde directamente y sirve para designar al conjunto de las cosas que son rojas -en notación de teoría de conjuntos, el adjetivo 'rojo' se representa como l X rojo(X), siendo una expresión con referencia 'al conjunto de las cosas rojas'-.

    Desde el punto de vista de la GC resulta obvio aceptar que, siendo como es el lenguaje un sistema simbólico convencionalizado, éste impone una serie de categorías a sus usuarios; pero ello no debe implicar que las categorías sean necesariamente arbitrarias, sino que diversos factores (p.e. las discontinuidades que de hecho existen en el mundo, los mecanismos perceptivos de los humanos, etc.) son susceptibles de actuar como desencadenantes de la formación de categorías lingüísticas. Por tanto la categorización (p.e., formación del concepto léxico [rojo] ), deberá ser entendida como el resultado de una dialéctica entre convención lingüística y motivación externa.

    Otra consecuencia de orden metodológico en la GC es el enfoque radicalmente semanticista del estudio del lenguaje. En palabras de Lakoff (1987), "meaning is all language is about": de lo que trata el lenguaje es del significado. Es decir, nada en lingüística tiene razón de ser si no se contempla desde el punto de vista de la conceptualización y la transmisión de significado, luego el estudio de la sintaxis como sistema autónomo o módulo únicamente sujeto a una dialéctica de input/output (entran estructuras lingüístico-semánticas, salen formas fonológicas; o viceversa), es visto como un sinsentido. Como efectos principales de dicho enfoque tenemos las siguientes hipótesis de trabajo:

    · Las estructuras sintácticas no son constructos generativos de origen innato, sino elaboraciones de un conjunto de esquemas o patrones prototípicos -kernels- adquiridos en la fase de aprendizaje de cada lengua en particular
    · Los miembros de las categorías sintácticas comparten un conjunto básico de propiedades semánticas (cf. Langacker, 1987)
    · No existe contraposición entre semántica lingüística y conocimiento general: la organización del significado es un todo indisociable.

    Queda fuera del alcance de este trabajo el ofrecer una revisión general del trabajo realizado en GC, tanto por amplio y diverso como por heterogéneo en cuanto a puntos de vista de los diversos autores sobre el mismo tipo de temas. Me limitaré pues a exponer las bases generalmente admitidas como comunes dentro de la corriente y su relación con los fenómenos parte-todo.
 
      Prototipos

    Uno de los puntos de partida básicos de la GC es, como he apuntado, el trabajo del equipo de Rosch (p.e. Rosch, 1973) sobre categorización, entendida como la organización de los conceptos sobre la base de la noción de prototipo. En dicho modelo se postula un nivel central o básico de formación de conceptos que actuaría en los primeros años de vida de la persona, en el que de forma no analítica ni reflexiva ciertas entidades exteriores muy prominentes perceptualmente y muy entrañandas en la propia naturaleza y el entorno inmediato de la persona son captadas y conceptualizadas de modo global, como un todo -y no, por ejemplo, como una síntesis de sus partes-.

    Dichos conceptos básicos no constituyen clases entendidas como conjuntos cerrados de entidades, sino como categorías radiales de límites difusos, sujetas a un determinado grado de proximidad a un prototipo. Un ejemplo típico (p.e. vid Kleiber, 1990) es el de la adquisición del concepto [bird] ('ave'). Desde el punto de vista tradicional la asignación de individuos a dicha clase se realizaría basándose en un conjunto compartido de condiciones necesarias y suficientes, p.e. 'tener plumas y pico', 'ser ovíparos' y 'volar'. Sin embargo tales rasgos no son lo suficientemente discriminatorios acerca de la pertenencia a la categoría: los pingüinos no tienen plumas, los ornitorrincos no son aves y tienen pico, los ofidios también son ovíparos, las avestruces no vuelan -y ciertos peces e insectos sí-.

    Según la hipótesis de Rosch, la clase vendría definida -y se formaría- a partir de la consideración de uno o varios ejemplos prototípicos -p.e., en nuestro entorno, el gorrión o la gallina-, que actuarían como núcleo de la categoría, juzgándose la pertenencia a la misma de los nuevos candidatos a ser denominados 'aves' a partir del grado de similitud o cercanía al prototipo. De esta forma las categorías constituirían conjuntos difusos (al estilo de Zadeh, 1965), en las que existiría una gradación desde miembros óptimos hasta miembros dudosos de la categoría, pasando por miembros buenos, aceptables, etc. -p.e. un gorrión sería un ejemplo claro e indudable de ave, pero un pingüino un ejemplo ya no tan claro, y por tanto situado en una zona marginal de la categoría-.

    Como he apuntado anteriormente, tal concepción de la categorización se considera aplicable a cualquier tipo de categorías mentales, incluidas las categorías lingüísticas. También éstas se organizarían -y serían adquiridas- a partir de prototipos. Por ejemplo, Langacker (1987) considera como prototipos de la categoría 'nombre' las palabras que designan entidades tridimensionales, concretas y discretas ('mesa', 'gato'), mientras que palabras como 'llegada', 'verdor', 'altura', 'equipo' u 'honradez' serían miembros no tan claros de la categoría, puesto que se asimilarían a ella por proyección del esquema espacial básico a otros dominios (tiempo, color, etc.). En el caso de las categorías lingüísticas, como en el de las categorías cognitivas generales, una mayor grado de adecuación a la categoría corresponderá a un mayor cumplimiento de requisitos o propiedades atribuidas a la misma; p.e. en el caso de las categorías morfosintácticas, los mejores ejemplos de nombre son más susceptibles de pluralización que los ejemplos marginales('gatos'/*'honradeces'). Esta relación entre la idoneidad semántica ejemplar-clase y efectos lingüísticos es denominado en GC efecto prototípico, y se considera que se manifiesta en todos los ámbitos del lenguaje.

    Rosch postula una estructuración de las categorías mentales en tres niveles: el antes mencionado nivel psicológicamente básico (p.e. 'pájaro'), el supraordinado que agrupa categorías del nivel de base (p.e. 'animal') y el subordinado que las subdivide (p.e. 'jilguero') -vid fig. II.6-.


Fig. II.6: Niveles de categorización

    Para Lakoff (1987) las categorías de nivel básico lo son en cuatro sentidos: perceptivo, funcional, comunicativo y de organización del conocimiento; los cuales corresponden a diversas conclusiones extraídas por Rosch (Rosch et al., 1976). Para dichos autores el nivel básico es:

    · A nivel perceptivo

    · El nivel más alto en el cual los miembros de la categoría tienen una forma general similar a los de la categoría y diferente de la de las otras categorías
    · El nivel más alto en el cual una única imagen mental puede reflejar toda la categoría
    · El nivel en el que los sujetos más rápidamente identifican miembros de la categoría

    · A nivel funcional

    · El nivel más alto en el que la persona utiliza acciones motoras similares para interaccionar con los miembros de la categoría (p.e., dadas las categorías de base 'silla' y 'mesa', hipónimas de la superordinada 'mueble', las acciones relacionadas con tipos de sillas son similares entre sí y distintas de las relacionadas con tipos de mesas)

    · A nivel comunicativo

    · El nivel en el que los nombres con que se designan los miembros de la categoría son habitualmente más cortos
    · El nivel en que los nombres con que se designan los miembros de la categoría son los más usados habitualmente
    · El nivel en que los términos con que se designan los miembros de la categoría son usados en contextos neutros (p.e. 'hay un perro en la puerta' puede ser usado en un contexto neutro, mientras que 'hay un mamífero en la puerta' o 'hay un dálmata en la puerta' requieren contextos especiales)
    · El primer nivel que es nombrado y comprendido por los niños y el primer nivel en entrar en el lexicón

    · A nivel organizativo

    · Aquél nivel en el cual se organiza la mayor parte del conocimiento: la mayoría de información sobre atributos de los miembros de categorías se concentra en este nivel

    Diversos autores aportan otros aspectos en que presumiblemente el nivel fundamental de categorización es psicológicamente más prominente. Por ejemplo, el nivel básico es también aquél en que los nombres se recuerdan de forma más rápida y directa; y también el nivel en que las cosas son percibidas en forma de una única gestalt mientras que para distinguir entre categorías subordinadas se precisa de detalles de orden muy específico.

    Esta última noción nos conduce a la consideración de la importancia de las relaciones parte-todo en la categorización, tema del cual trataremos con mayor detalle más adelante. Sin embargo, con anterioridad, es preciso dar cuenta de que la organización de categorías a partir de prototipos no es la única hipótesis que baraja la GC: otras hipótesis relevantes son las de los esquemas mentales (Langacker) y los modelos cognitivos idealizados (Lakoff).
 
    Esquemas de categoría

    Langacker (1987) postula que coexisten dos mecanismos en la estructuración de categorías: la extensión a partir de un prototipo y lo que él denomina extensión de un esquema. La diferencia fundamental entre ambos es que los esquemas son compatibles con la totalidad de miembros de la categoría que definen, luego no están sujetos a una gradación como en el caso de la categorización a partir de prototipos. Para Langacker, tanto los miembros prototípicos (p.e. [gorrión] ) como los marginales ([pingüino] , [avestruz] ) de una categoría ([ave] ) responden a un único esquema mental y son especificaciones del mismo.

    Según su hipótesis, en un primer estadio de adquisición, una categoría se forma a partir de uno o varios prototipos (p.e. [gorrión] ), y a partir de éstos se elabora un esquema mental. La ulterior asimilación de nuevas instancias a la categoría motiva, de forma progresiva, la modificación del esquema -p.e. relajación de restricciones de tamaño al incorporar [avestruz] - hasta que el esquema se estabiliza definitivamente.

    Para Taylor (1989) dicha hipótesis es en principio criticable dado que en muchos casos es muy difícil concebir esquemas lo suficientemente discriminatorios que subsuman a la totalidad de miembros de una categoría. Su conclusión final es que la categorización por esquema y la categorización por prototipo son en realidad aspectos diferentes de un mismo fenómeno, dependientes en última instancia del grado de abstracción que se quiera atribuir a las representaciones mentales -lo que, por otra parte, no niega Langacker, el cual admite la coexistencia de ambos procedimientos-.
 
    Modelos Cognitivos Idealizados (MCIs)

    Tampoco está exento de críticas el modelo de categorización por prototipos. Aunque el modelo de Rosch en líneas generales es aceptado y valorado como hipótesis de trabajo central en categorización, no es menos cierto que se ha constatado que no todo en la formación de categorías tiene una explicación en términos de prototipos. Tomemos en consideración, para acercarnos de modo intuitivo a la cuestión, algunos ejemplos típicos manejados en trabajos de GC como son los nombres 'madre', 'solterón' y 'lunes'.

    En el primer caso es ciertamente plausible que la adquisición del concepto, 'madre' provenga de las experiencias básicas propias. En general, salvo casos desafortunados (y a expensas de lo que pueda ocurrir en la era de la clonación y la ingeniería genética), todo el mundo tiene una madre identificable y parece razonable admitir que la consciencia de la existencia de la propia madre sirva como detonante o prototipo para la formación de la categoría. Pero no debe perderse de vista que la utilización de la palabra en derivados ('madrastra', 'matriarcado'), compuestos ('madre adoptiva', 'madre de leche', 'madre política', 'lengua madre -o materna-', 'salirse de madre') o sentidos extendidos ([monja] , [cauce de un río] ), sugiere la existencia de un haz de información asociado a 'madre' que excede del simple esquema reproductivo, pudiendo considerarse (como hace Lakoff, 1987) que también están implicados en su significado aspectos relacionados con nutrición, estructura familiar o jerárquica, orden natural de las cosas, etc.

    De forma más clara, casos como 'lunes', 'día', o 'semana' parecen ciertamente inaprensibles desde el punto de vista de categorización por prototipos. La existencia de un 'lunes' o una 'semana' prototípicos no parece que sea algo que pueda postularse. Un caso intermedio entre 'madre' (en principio categorizable a partir de un prototipo) y 'lunes' (de muy dudosa prototipificación) es el de 'bachelor' ('soltero').

    La experimentación directa de la existencia de un 'soltero' prototípico es, como caso general, de más dudosa postulación como detonante de formación de la categoría. Más bien parece que el concepto deba enmarcarse en la consciencia de un cierto orden social típico, dentro del cual las personas, a una determinada edad, suelen estar casadas, de modo que las que no se ajustan al modelo reciben una cierta denominación específica. Desde este punto de vista, la pertenencia de un individuo a la categoría parece ser un caso de sí o no: una persona se ajustará o no al modelo 'soltero', con lo que la categoría no será difusa ni sujeta a proximidad a un prototipo.

    Sin embargo Fillmore (1982a) hace notar que no todos los adultos no casados son igual de buenos ejemplos de 'soltero': un cura, Tarzán o un homosexual pueden ser denominados como 'solteros', pero no como 'solteros' propiamente dichos. Para Lakoff (1987) no debe hablarse en este caso de la existencia de prototipos, sino de asimetrías en la categoría o efectos de prototipicidad, los cuales dimanan de la contrastación de dos tipos de esquemas o modelos cognitivos -en este caso los de 'soltero' y, p.e., 'cura'-. Una mayor o menor compatibilidad de ambos esquemas dará lugar a una mayor o menor sensación de buen ejemplo de la categoría. Así, desde el punto de vista de Lakoff, la noción de ejemplar prototípico pierde relevancia en favor de la de efecto de prototipicidad.

    Para dar cuenta de este tipo de efectos, nuevamente, parece ser precisa una concepción de la estructura de las categorías más compleja que la postulada por Rosch: una estructura, el Modelo Cognitivo Idealizado, en la que jugarían un papel diversos tipos de mecanismos cognitivos, entre ellos la metonimia. Así lo parece avalar la existencia del efecto prototípico de la extensión metonímica de significado, en donde de dos sentidos relacionados de una palabra (p.e. 'ternera': el animal y la carne), uno es concebido como central ([animal] ) y el otro ([carne] ) como derivado -cf. Kleiber (1990)-.

    Lakoff (1987) no define de forma explícita la noción de MCI, sino que la caracteriza como un conjunto estructurado de conocimiento asociado a una forma lingüística, en el cual se utilizan cuatro tipos de mecanismos: correspondencias metonímicas, correspondencias metafóricas, estructuras esquemáticas (cf. Langacker, 1986) y estructuras proposicionales al estilo de los marcos ('frames') de Fillmore (1982b).

    La noción de MCI no es radicalmente novedosa sino que está emparentada con diferentes propuestas de representación del conocimiento provinentes en último término del área de la inteligencia artificial (IA). De hecho, términos tales como frame -Fillmore-, domain ('dominio') -Langacker- o script ('guión') -Shank y Abelson (1977)- son utilizados en GC y en IA para referirse a constructos de orden más o menos similar. La noción fillmoriana de frame es deudora (cf. Lakoff, 1987) de los métodos de representación del conocimiento de Minsky (1975) y Rumelhart (1975), en dónde un marco o esquema es una red de conexiones entre nodos representativos de categorías conceptuales; y las propiedades de una cierta categoría dependen de factores tales como su rol en el esquema, su relación con otros nodos del esquema o la relación del esquema con otros esquemas. Los scripts, por su parte, configuran una secuencia temporal de relaciones causales en la que acciones, procesos y estados se imbrican dando lugar a una representación del conocimiento asociado a un cierto tipo de acción o situación.

    La noción que subyace a dicho tipo de constructos mentales es, para Taylor (1989), la de contextualización del significado, ya presente en las aproximaciones estructuralistas, pero con una diferencia radical de matiz en el cognitivismo: la negación de la existencia de un conocimiento semántico-lingüístico disociado de un conocimiento semántico general (o conocimiento del mundo). En efecto, ya para la concepción de la lingüística que nace en Saussure (1916), el significado es dependiente del contexto, pero de un contexto interno al lenguaje, fruto de las relaciones sintagmáticas y paradigmáticas establecidas entre los signos dentro del sistema lingüístico. Para la GC, por contra, el contexto dentro del cual se caracterizan los significados de los signos es externo al sistema lingüístico como tal: el significado de una forma lingüística sólo puede ser comprendido en el contexto de otras estructuras cognitivas, sin que sea especialmente relevante que tales estructuras se hallen o no lexicalizadas en una lengua en particular.

    Para ilustrar tal aproximación al significado Taylor (1989) vuelve a los ejemplos de 'lunes', 'día', 'semana', etc. 'Lunes' sólo es comprensible dentro del contexto del concepto [semana] , como estructura dividida en siete partes ([días] ) temporalmente iguales pero distintas en otros aspectos, p.e. unos días son laborables y otro/s de descanso (de ahí 'fin de semana') y su posición dentro del ciclo hace que cada uno de los siete días de la semana reciba nombres diferentes. Además, el concepto [día] debe ser explicado en el contexto del ciclo natural día-noche y, en último término, tanto [día] como [semana] en el contexto de la percepción del transcurso del tiempo.

    Para Langacker (1986) la semana es un esquema mental o dominio, resultando tal concepto especialmente relevante para su aproximación a las categorías lingüísticas en tanto en cuanto que, para Langacker, las formas lingüísticas adquieren significado por el método de perfilar (o destacar) una región en algún dominio. Así, el significado de la palabra 'lunes' vendrá dado por la delimitación, en el dominio cíclico 'semana' de una de sus partes (longitudinalmente dispuestas en el tiempo), aquélla que sucede a la última parte de tipo festivo (vid. fig. II.7).
 


Fig. II.7: significado de 'lunes' en términos de Langacker (1986)
 

    Conjuntos estructurados de conocimiento como el que acabamos de ver, relacionado con los días de la semana, es lo que Lakoff entiende por MCIs. En definitiva, los MCI recogen propuestas anteriores de representación del conocimiento, consistiendo la principal innovación de Lakoff la unificación de dichos constructos (configuraciones estáticas como los frames de Fillmore, dinámicas como los scripts de Shank y Abelson, esquemáticas como los dominios de Langacker), su aumento con mecanismos de extensión del significado (metáforas y metonimias, cf. Lakoff y Johnson, 1980), y su elevación al rango de categorías del pensamiento de tipo holístico.

    La categorización mediante MCIs tiene, para Lakoff, efectos de todo tipo en la utilización y comprensión del lenguaje, pudiendo citarse algunos como los efectos prototípicos antes mencionados en 'bachelor' o en las extensiones de significado animal-carne, la concepción de conceptos léxicos como partes de otros conceptos léxicos, metonimias como 'Madrid ha roto relaciones con La Habana', o desambiguación de compuestos nominales como los de (3) -cf. Taylor, 1989-, en dónde el conocimiento asociado al uso y constitución de botas y zapatos hace que (3a) sea interpretado como 'zapatos hechos de piel de cocodrilo' y no como 'zapatos para ser llevados por cocodrilos' -como 'zapatos de señorita' en (3b)-, 'zapatos para ser llevados en zonas de cocodrilos' -como 'botas de montaña' en (3c)- o incluso 'zapatos para ser llevados en tiempo de cocodrilos', como 'botas de lluvia' en (3d).

    (3)
    a. Zapatos de cocodrilo
    b. Zapatos de señorita
    c. Botas de montaña
    d. Botas de lluvia

    Hasta aquí hemos visto las líneas generales del programa cognitivista. A continuación trataré de forma más precisa el rol de las relaciones parte-todo en dicho marco teórico.
 

    2.2.1.1 Categorización y relaciones parte-todo

    La hipótesis Berlin-Hunn (Berlin et al. 1974; Hunn 1977) según la cual el aspecto determinante del nivel básico de categorización es la percepción de la configuración general parte-todo (o percepción gestalt) se ve claramente confirmada para Lakoff (1987) por el cuerpo de evidencia experimental obtenido por Tversky y Hemenway (1984) -ver también Tversky (1986) cf. Kleiber (1990)-.

    La observación fundamental de Tversky es que el nivel básico se distingue del superordinado y el subordinado en el tipo de atributos que se suelen asociar a los miembros de dicho nivel categorial; de forma especial, en la asociación de atributos relacionados con partes de las entidades. En otras palabras, el conocimiento en el nivel básico se organiza principalmente alrededor de divisiones parte-todo, por tres razones principales:

    · Las partes suelen tener como correlatos funciones; en consecuencia el conocimiento relacionado con funciones suele estar relacionado con el conocimiento relativo a partes de las entidades
    · Las partes determinan la forma; en consecuencia determinan el modo en que un objeto es percibido
    · Los humanos suelen interactuar con los objetos a traves de las partes de dichos objetos; en consecuencia las divisiones parte-todo juegan un papel fundamental en la determinación de los programas motores usados para interactuar con los objetos (p.e., un 'asa' no es simplemente una parte curvilínea de ciertos objetos, sino también algo que los hombres utilizan para agarrar dichos objetos).

    El efecto de las relaciones parte-todo en los distintos niveles de categorización puede ejemplificarse retomando el ejemplo de los animales. Se admite en GC que, en general, las diferentes categorías de base hipónimas de una misma categoría supraordinada se distinguen entre sí de forma fundamental por rasgos de parte y se agrupan en dicha categoría superordinada por compartir otro tipo de atributos. En cambio, las diferentes categorías subordinadas hipónimas de una misma categoría básica se agrupan en ella por compartir rasgos de parte y se distinguen entre sí por otro tipo de atributos (p.e. tamaño o color).


Fig. II.8: Categorización y rasgos parte-todo
 

    Esta concepción puede verse de forma más clara a partir de los ejemplos de la taxonomía parcial representada en la Fig. II.8. En ella al nivel central (pájaro, perro) representa categorías de nivel básico; y el superior y el inferior, respectivamente, niveles superordinado (animal) y subordinado (canario, jilguero, dálmata, perdiguero). Nótese que, en dicha jerarquía:

    - Las categorías básicas se distinguen entre sí por rasgos de parte: los pájaros tienen plumas, pico, alas, etc.; los perros no.
    - Las categorías básicas se agrupan en la superordinada a partir de otro tipo de atributos -distintos de los rasgos de parte-: pájaros y perros, pese a diferir en esquemas parte-todo, tienen en común el hecho de ser seres animados, por ello se agrupan en la categoría [animal]
    - Las categorías subordinadas se agrupan en una de nivel básico por compartir esquemas parte-todo; y se distinguen entre sí por atributos de otro tipo: jilgueros y grajos se agrupan en [pájaro] por tener alas, plumas etc., mientras que se distinguen a causa del tamaño, el color, etc.

    Consideraciones como las anteriores no tienen porque restringirse únicamente al dominio de los objetos físicos: Lakoff (1987) y Lakoff y Johnson (1980) postulan asimismo que las entidades abstractas y las temporales (eventos) se estructuran de forma análoga por extensión metafórica a partir del esquema parte-todo típico de las entidades tangibles. Así, en MCIs del tipo de 'viaje' intervienen diversos subesquemas (unión-separación, proximidad-distancia), entre ellos un esquema parte-todo, configurado por los conceptos [origen] , [recorrido] y [destino] ('source', 'path', 'goal').

    Postula Lakoff (1987) que la organización del pensamiento está mediatizada por la existencia de cierto número de esquemas básicos nacidos a partir de la experimentación y percepción de nuestro entorno inmediato, y, de forma especial, de nuestro propio cuerpo. Prestaremos atención aquí a los dos más relevantes: los esquemas parte-todo y contenedor-contenido.

    El esquema contendor-contenido surge para Lakoff -siguiendo los postulados de Johnson (1987)- a partir de la constante experimentación de nuestros cuerpos simultáneamente como contenedores (p.e. en funciones primarias como la ingestión, la excreción o la respiración) y como elementos situados en contenedores (p.e. en casas o coches). Dicho esquema se estructura a partir de los conceptos de [interior] , [límite] y [exterior] , y define la distinción básica entre [dentro] y [fuera] -y la consiguiente [entrar] -[salir] ), de aplicación constante en el lenguaje tanto en registros concretos como en abstractos o metafóricos ('no me lo puedo quitar de la cabeza', 'entró en estado de coma', 'salir de su estupor', 'vomitar insultos', etc.)-.

    El esquema parte-todo procedería asimismo de la experimentación vital del propio cuerpo como un todo distinguible en partes, consciencia que se extrapolaría hacia la concepción del resto de cosas del mundo (concretas y abstractas) como todos estructurados en partes. Por ejemplo la familia y otras organizaciones sociales son entendidas como todos compuestos de partes ('desmembrar una familia', 'unirse en matrimonio', 'Nicéforo ha roto con su novia', etc.).

    Evidencias de una concepción antropomórfica de las relaciones de parte pueden hallarse en la constante utilización en todas las lenguas de términos de partes del cuerpo en la construcción de nombres de partes de otras cosas. Levinson (1994) estudia en profundidad el fenómeno en el tzeltal, relatando la existencia de construcciones tan interesantes como 'la nariz del pecho' (por pezón), 'el cuello de la pierna' (tobillo), 'la espalda de la silla' (respaldo), 'la nariz de la pirámide' (cima) o 'la oreja de la jarra' (asa). Aunque no es preciso ir tan lejos para encontrar dicho tipo de extensiones metafóricas, como puede verse en los ejemplos del castellano de (4).

    (4)
    a. La cara de la moneda
    b. El corazón de la selva
    c. El cabeza de familia
    d. Un brazo de mar
    e. Una mano de póker
    f. Un ojo de buey
    g. El pie de la montaña
    h. El ombligo del mundo
    i. La boca del metro
    j. la piel de la manzana
    k. Una cabeza de ajos

    A modo de breve conclusión de lo expuesto en este apartado consideraremos que, desde el punto de vista de la GC, las relaciones parte-todo no deben, o posiblemente no puedan, ser vistas (como en las aproximaciones lexicalistas reseñadas en 2.1) simplemente como un caso de relaciones entre palabras tomadas como átomos de significado, sino más bien como un medio fundamental de estructuración del pensamiento y de construcción de las categorías mentales; con los consiguientes efectos en sus correlatos, las categorías léxicas, y detectables en el lenguaje en general.
 

    Tipos de esquemas parte-todo: Iris et al. (1988)

    El trabajo del grupo de psicolingüistas que he presentado en § 2.1 resulta en cierta forma abrumador en cuanto a la diversidad de clasificaciones y al grado de subclasificación de las relaciones semánticas que genera. Este aspecto y el de la teoría en que se basa, la descomposición de las relaciones en elementos relacionales, para los que se postula entidad psicológica real a tenor de los experimentos realizados, da lugar a valoraciones escépticas, entre ellas la más notable la llevada a cabo desde una posición cognitivista por Iris, Litovitz y Evens (1988), quienes rechazan la validez de tal aproximación por considerar que contiene desviaciones o prejuicios causados por la naturaleza ad-hoc de la lista de ejemplos usada con los sujetos del experimento, con lo que la clasificación resultante está asimismo viciada. En sus propias palabras:

    "(...) the results obtained by Chaffin and his coworkers indicate how their particular subjects performed on a set of words proposed by the experimenters; it is not clear how this performance relates to native speakers' abilities to identify and label parts and wholes. Nor it is necessary to suppose that in natural situations speakers use Chaffin's 'decompositional strategy' in their decisions"

    ["(...) los resultados obtenidos por Chaffin y sus colaboradores indica como unos sujetos particulares reaccionan ante un grupo de palabras propuestas por los experimentadores; no está claro cómo esta reacción se relaciona con la capacidad de los hablantes para identificar y etiquetar partes y todos. Ni es nececesario suponer que, en situaciones naturales, los hablantes usan la 'estrategia descompositiva' de Chaffin en sus decisiones."]
 

(Iris et al., 1988)

    La hipótesis alternativa de los autores, fundamentada en el análisis de corpus y diccionarios, es que los hablantes tienen modelos o esquemas de unos pocos tipos de relaciones parte-todo, los cuáles difieren entre sí en términos de (i) discretividad y entitatividad (o forma) del todo y de la parte; y (ii) en términos de qué se formó primero, la parte o el todo. Entre dichos esquemas constarían en principio los siguientes:

    · Componente Funcional-Todo (rueda-coche)
    · Segmento-Todo (rebanada de pan, grano de arroz, taza de arroz)
    · Miembro-Colección (oveja-rebaño)
    · Inclusión de Conjuntos (manzana-fruta)

    Para las autoras el esquema Componente Funcional - Todo se caracteriza fundamentalmente porque las partes pueden existir antes que el todo y por que el todo se construye a partir del ensamblaje lógico de sus partes. Sin embargo reconocen que ello no siempre es cierto; por ejemplo la relación entre el cuerpo y sus órganos caería dentro de este tipo, y no puede afirmarse ni la preexistencia de los órganos ni la constitución del cuerpo por ensamblaje de ellos.

    Los esquemas Miembro-Colección e Inclusión de Conjuntos no se definen en el trabajo de Iris et al. (1988) de forma precisa, remitiéndose a la noción lógica de conjunto y sus relaciones de subconjunto y pertenencia de elementos.

    El esquema Segmento-Todo, finalmente, se caracteriza, como mínimo, por los siguientes aspectos:

    · La posibilidad de extracción de la parte (o la divisibilidad del todo).
    · Se atribuye a la parte algún tipo de cualidad de entidad. En algunos casos la parte tiene una medida y una forma predetermidadas. P.ej. 'rebanada de pan' connota una forma, medida y espesor particulares, pero por contra, palabras como 'fragmento' no implican medida o forma particulares.
    · El todo ha de preceder a la parte (no se puede tener un trozo de pastel antes de que exista el pastel).
    · El todo puede ser discreto o continuo, lo que se refleja en el lenguaje en la distinción masa-contable (judías-arroz).
    · Los términos genéricos de individuación de masa pueden extenderse a palabras-masa abstractas e inmateriales ('un poco de información') -observación debida a Jespersen (1933)-.
    · Los nombres generales colectivos ('un montón de arena') o los nombres de medición ('una taza de arroz'), se considera que dan límites a las masas, las cuales previamente son todos amorfos. En un sentido más general, es posible trazar límites alrededor de segmentos de un todo.
    · Una concepción geométrica euclidiana del espacio está implicada en el modo en como los hablantes conceptualizan las cosas: los niños aprenden en su etapa de maduración y desarrollo que las flechas tienen punta, los bosques tienen límites, etc.

    Es digno de ser notado que la totalidad de ejemplos ofrecidos para ilustrar el esquema Segmento-Todo no consisten, como en el resto de esquemas, en pares de palabras relacionadas, sino en construcciones partitivas ('rebanada de pan', 'trozo de pastel', etc.)

    En otro orden de cosas, las autoras corroboran en líneas generales la tesis de Winston et al. (1987) relativa a que parte-todo no es una relación sencilla sino una colección de relaciones. Pero a diferencia de éstos no mantienen que siempre exista transitividad dentro de un mismo tipo de relación meronímica, sino que la transitividad opera únicamente en las relaciones Segmento-Todo (un trozo de un trozo de una cosa es un trozo de dicha cosa) e Inclusión de Conjuntos (si un canario es un pájaro y un pájaro es un animal, un canario es un animal); pero no en las relaciones de Parte Funcional y de Miembros de Conjuntos.

    Respecto a la relación de Parte Funcional argumentan que la no transitividad de ejemplos del tipo del clásico de Lyons (1977) 'empuñadura'® 'puerta'® 'casa' se debe a que la noción de funcionalidad de una entidad respecto a otra implica la de que la parte en cuestión es un componente mayor -especialmente relevante- del todo, relación que suele perderse al concatenar de forma transitiva dos relaciones de parte. En el ejemplo, puede decirse que la [empuñadura] es un componente mayor de la [puerta] , y que la [puerta] es un componente mayor de la [casa] ; sin embargo, la [empuñadura] no puede postularse como componente mayor de [casa] , por lo que el efecto es que la transitividad no opera en dicha concatenación de relaciones.

    Respecto a la no transitividad de la relación de Miembro a Conjunto el argumento es el siguiente: si un conjunto S tiene como miembros a los pares {a,b} y {c,d}, puede decirse que 'a' es miembro del conjunto {a,b}, pero no que es miembro del conjunto S, dado que los elementos de S son, por definición, pares {x,y}, y 'a' no es un par, sino un elemento simple.

    Asi, en resumen, las diferencias principales del trabajo de Iris et al. (1988) respecto al trabajo de Winston, Chaffin, y sus colegas son:

    · Se considera que la relación Es-Un (llamada "Inclusión de Conjuntos") es un tipo de relación parte-todo.
    · Se considera que los hablantes tienen esquemas mentales generales únicamente para tres relaciones merológicas fundamentales (excluimos la relación Es-Un). La sobreclasificación ofrecida por los psicolingüísticas no se considera fundamentada.
    · Dentro de las relaciones puramente merológicas se considera que la transitividad únicamente se da dentro de la relación Segmento-Todo.
    · Pese a que no se menciona explícitamente, a tenor de los ejemplos de cada relación que se ofrecen, no se desprende que la relación Segmento-Todo sea, como en los demás casos, una relación entre pares de palabras (lo que sí se desprende de la aproximación psicolingüística, en cuyos ejemplos -a la sazón ofrecidos a los sujetos del experimento para que los juzguen- sí existen pares tales como grano-sal o trozo-pastel).

    Tras haber presentado en esta sección la visión cognitivista de la merología, en la siguiente recapitulación pasaré a considerar cuáles son, a mi juicio, los aspectos de dicho modelo que pueden resultar más relevantes para la representación del conocimiento parte-todo.
 

    2.2.1.2 Recapitulación

    El modelo del significado que plantea el cognitivismo es de índole más general que el modelo semático-léxico de Miller y Johnson-Laird de modo que puede entenderse como que este último es subsumible en el primero.

    En primer lugar es preciso notar que el modelo cognitivista plantea una estructuración del significado en la mente de los hablantes que no puede circunscribirse al conocimiento semántico-lingüístico, sino que, por el contrario, conocimiento semántico-lingüístico y conocimiento semántico general forman un todo indisociable. En dicho marco, pues, la asunción fundamental léxico-relacionalista de que el significado de las unidades léxicas viene definido por las relaciones que establecen con otras unidades léxicas, queda subsumida en un modelo en el que el significado de todo tipo de categorías y estructuras cognitivas viene definido por las relaciones que establecen con otras categorías y estructuras cognitivas; resultando incidental en este orden de cosas que categorías y estructuras cognitivas estén o no asociadas a etiquetas léxicas: es de esperar que mientras ciertas categorías, modelos o esquemas serán expresables en una lengua dada mediante un único lexema, otras lo serán mediante construcciones lingüísticas más complejas.

    A efectos de representación del conocimiento lingüístico, podemos extraer las siguientes conclusiones básicas:

    · El significado de las unidades lingüísticas deberá ser representable por relación a esquemas de conocimiento general, tanto lingüístico como extralingüístico.
    · Este modelo del significado no es representable mediante formalismos puramente léxico-relacionales (como WordNet), resultando más adecuados formalismos de tipo frame, basados en estructuras de rasgos, en el que los rasgos puedan ser tanto unidades léxicas como tipos de una ontología que sea modelo de una estructura cognitiva general.

    De modo especial, por lo que refiere a la representación del conocimiento parte-todo, destacaremos como más relevantes los siguientes aspectos de la aproximación cognitivista:

    · El enfoque originado en el trabajo de Rosch destaca la importancia del conocimiento parte-todo en la propia construcción del significado. Los rasgos de parte pasan de ser considerados un mecanismo de estructuración del lexicón a un mecanismo de creación del significado.
    · El conocimiento parte-todo comparte con el conocimiento de función y con los atributos perceptuales (forma, color, disposición,...) este status privilegiado de elemento constructor del significado. Ello resulta especialmente relevante para los propósitos de este trabajo puesto que el formalismo básico de representación lingüística que utilizaré (Pustejovsky, 1995), pese a no estar basado en el modelo cognitivista, precisamente contempla de forma implícita, como rasgos fundamentales de descripción del significado, modos de conocimiento relativos a partes, a función, y a aspectos formales -perceptualmente relevantes- de los conceptos.
    · Los esquemas parte-todo no son vistos como puras asociaciones de pares léxicos, sino que -según se infiere del análisis que del esquema que denominan segmento-todo hacen Iris et al. - se trata de esquemas generales que pueden fraguar en el lenguaje en construcciones más complejas.
    · La multiplicidad de relaciones parte-todo propuestas por las aproximaciones psicolingüísticas son vistas como inmotivadas, siendo el reflejo de una metodología experimental tendente a imponer a los sujetos del experimento tipos de relación apriorísticos. Por contra, se postula que existe un número muy reducido y general de esquemas merológicos: componente funcional-todo, miembro-colección, y segmento-todo.

    La hipótesis planteada en este último punto implica, respecto de la aproximación de Winston et al. (1987), la subsunción de las relaciones lugar-área, material-objeto y fase-actividad de alguno de los tres tipos mayores -siendo los otros tres tipos de relación de Winston et al. asimilables a éstos-.

    A mi juicio, como expondré en §4.2, lugar-área es subsumible en componente funcional-todo; las relaciones fase-actividad pueden ser vistas como realizaciones en el plano temporal de esquemas componente-todo o segmento-todo; y la ausencia de relación objeto-material debe ser reputada como una omisión del modelo de Iris et al.
 
 

2.2.2 La semántica conceptual: Jackendoff

    Partiendo de la asunción global de que la información relativa la inclusión de entidades y sucesos en otros más genéricos no es un problema simplemente léxico sino un fenómeno de orden conceptual, expresable en el lenguaje de múltiples modos, Jackendoff (1991) expande ciertos aspectos del marco teórico que ha venido desarrollando en los últimos años, la semántica conceptual , a fin de dar cuenta de una serie de fenómenos de la semántica de los nominales, tales como la distinción masa-contable, la pluralidad, las construcciones partitivas, las construcciones constitutivas (p.e. 'una casa de madera'), las palabras de límites ('final', 'borde', 'superficie'), o el denominado universal packager -construcción de la referencia a entidades individuadas a partir de nombres de masa, como 'un café' o 'dos cervezas'-.

    En la semántica conceptual, como en la GC, no se toma en consideración la referencia de las unidades léxicas hacia un mundo externo independiente de los hablantes, sino hacia un modelo representativo de la reconstrucción mental que los hablantes hacen del mundo. Jackendoff plantea su trabajo como una investigación de los principios de representación mental que dan lugar al pensamiento y su expresión mediante el lenguaje. Su hipótesis básica al respecto es la existencia de una representación mental, denominada estructura conceptual que sería innata y común a los hablantes de cualquier lengua. Ésta estaría en correspondencia, por un lado con otros tipos de representación mental (sistemas visual, auditorio, motor, etc.), y por otro con el componente sintáctico del lenguaje (vid. fig. II.3 en la introducción de este capítulo).

    La estructura conceptual estaría sujeta a unas reglas de formación compuestas de primitivas y principios combinatorios (ambos innatos) que conjuntamente darían lugar, de modo generativo, al conjunto total de conceptos posibles; entendiendo que tales conceptos pueden ser tanto léxicos (sentidos de palabras) como frasales (grupos, sintagmas, proposiciones). La aplicación de los principios combinatorios a las primitivas conceptuales es denominada por Jackendoff la sintaxis del pensamiento.

    La justificación del conjunto de primitivas y principios postulado radica, para el autor, simplemente en su pura capacidad de ofrecer explicaciones y dar cuenta de generalizaciones, de modo análogo a lo que se asume en cualquier otro campo de investigación, reclamando pues para la lingüística la validez del método científico habitual: postulación de modelos explicativos sujetos a falsación. En todo caso, independientemente de que dichas hipótesis innatistas y decomposicionales sean o no aceptadas, la semántica conceptual proporciona un marco de representación semántica que, por su descomposición en rasgos y por su potencial explicativo, resulta muy apto para la representación formal -y por ende computacional- del significado.
 
 

    2.2.2.1 Primitivas y funciones conceptuales

    A fin de introducir su sistema de rasgos y funciones conceptuales Jackendoff parte de un problema planteado por Talmy (1978), ilustrado por la oración (5a), equiparable a la oración española (5b).

    (5)
    a. The light flashed until dawn
    b. Gumersindo estornudó toda la noche

    El problema en (5) es la construcción de un significado iterativo (repetición de múltiples sucesos de un tipo) a partir de un sintagma que no comporta tal significado. Frases del tipo ejemplificado en (6) denotan un evento simple (una luz destella o alguien estornuda, una sola vez; y el evento termina). Por consiguiente debe reputarse como una contribución del significado de los complementos temporales ('until dawn'/'toda la noche') la que motiva una interpretación iterativa de las frases en (5).

    (6)
    a. The light flashed
    b. Gumersindo estornudó

    La explicación que ofrece Jackendoff a dicho fenómeno se basa en las nociones de delimitación (boundedness) y granularidad (internal structure) y reside en la interpretación de que la distinción entre nombres contables e incontables (count y mass en terminología anglosajona) es análoga y equiparable a la distinción entre eventos temporalmente delimitados (bounded) y eventos temporalmente no delimitados (unbounded). La intuición fundamental es que no es posible dividir (una entidad correspondiente a) un concepto delimitado y obtener otro concepto denominable mediante la misma expresión lingüística; lo cual sí es posible con los conceptos no delimitados. Por ejemplo, no puede dividirse una silla y obtener algo que pueda ser llamado 'silla'; sin embargo, sí puede dividirse algo llamado 'agua' y obtener algo que pueda seguir siendo llamado 'agua'. Del mismo modo, en el plano verbal, no puede dividirse un evento denominado 'Gumersindo estornudó' y obtener diversos eventos denominables 'Gumersindo estornudó', pero sí si se fracciona (en el tiempo) el evento 'Gumersindo dormía', los eventos resultantes pueden seguir siendo designados como 'Gumersindo dormía'.

    Una observación relacionada es que plurales y nombres incontables comparten la característica de no delimitación (una división cuantitativa de 'arroz' sigue siendo denominable como 'arroz', una división de 'lentejas' como 'lentejas').

    En consecuencia, Jackendoff propone etiquetar tanto plurales como nombres de masa (o incontables) como no delimitados. Plurales y nombres de masa, por una parte, y nombres contables, por otra, se distinguirán pues por serles atribuibles valores opuestos del rasgo conceptual booleano ± Delimitación (en lo sucesivo, ± D).

    En segundo lugar postula la existencia del rasgo ± Granularidad (en lo sucesivo ± G), que comparten plurales, grupos ('un comité') y agregados ('ganado'), el cual es indicativo de la estructuración interna de un concepto internamente estructurado en múltiples conceptos unitarios de un mismo tipo ([comité] : miembros del comité; [ganado] : animales; [animales] : animales individuales, denominables como 'animal').

    Ambos rasgos son aplicables tanto a entidades materiales como a eventos dando lugar a una clasificación de ambos tipos de conceptos del siguiente modo:

    · [+D -G] - Individuales (a pig, 'un cerdo')
    - Eventos Cerrados (John ran to the store, 'John corrió hacia el almacén')

    · [+D +G] - Grupos (a committee, 'un comité')
    - Eventos Iterativos Delimitados (the light flashed until down, 'la luz relampagueó hasta el anochecer')

    · [-D -G] - Sustancias (water, 'agua')
    - Procesos Homogéneos no-Delimitados (John slept, 'John durmió')

    · [-D +G] - Agregados (buses, cattle, 'autobuses', 'ganado')
    - Procesos Iterativos no-Delimitados (the light flashed continually, 'la luz estuvo relampagueando')

    Retomando el ejemplo (5b) introduciremos la noción Jackendoffiana de función. Una función es vista en semántica conceptual como un mecanismo que aplicado a un argumento -con los rasgos conceptuales que le son propios-, da como resultado una nueva estructura conceptual. El problema planteado -la emergencia de un significado iterativo en (5b) no existente previamente en (6b)- recibe para Jackendoff una explicación fundamentada en ciertas funciones y estructuras conceptuales subyacentes (y no siempre expresadas abiertamente) a las estructura lingüísticas, del siguiente modo:

    (i).- [estornudó] es un evento [+D-G] (una sola instancia de [estornudar] )

    (ii).- TODA LA NOCHE es una función delimitadora en el tiempo; por consiguiente necesita ser aplicada a eventos no delimitados en el tiempo ([-D]) - p.e. [Rodrigo durmió] -D -, alrededor de los cuales traza límites temporales:

    - [[Rodrigo durmió] -D toda la noche] +D

    (iii).- siendo [estornudó] un evento [+D], TODA LA NOCHE no es aplicable a [estornudó] ; como no lo es a [Feliciano dió un puñetazo a Edelmiro] :

    - * Feliciano dió un puñetazo a Edelmiro toda la noche

    (iv).- la función pluralizadora (PL) convierte conceptos [+D] en [-D+G], como en:

    - PL([silla] +D ) = [sillas] -D+G : silla

    en donde debe entenderse que el concepto [sillas] está compuesto de múltiples unidades del tipo [silla]

    (v).- la función PL suele corresponder a una marca morfológica (como en 'silla' ® 'sillas'), pero puede que no se de el caso en ciertos fenómenos -como en el que de modulación del significado verbal que ahora nos ocupa-

    (vi).- en 'Gumersindo estornudó toda la noche', PL se aplica a [estornudó] dando lugar a la siguiente estructura conceptual:

    - PL([estornudó] +D) = [estornudó] -D+G

    (vii).- a partir de este estado de las cosas, la función TODA LA NOCHE es aplicable a [estornudó] -D+G (por ser un evento -D); el resultado de la aplicación de TODA LA NOCHE será un evento +D compuesto de instancias del tipo [estornudó] -D+G

    La totalidad del proceso es representable algebraicamente como en (7):

    (7) TODA LA NOCHE(PL([estornudó] +D-G)-D+G)+D

    La interpretación de la representación (7) es:

    · [estornudó toda la noche] es un evento [+D] (delimitado en el tiempo); el cual traza límites temporales alrededor de un evento PL([estornudó] ); el cual a su vez es un evento (en sí no delimitado en el tiempo) compuesto de una multiplicidad de eventos simples (sí delimitados temporalmente) del tipo [estornudó] .

    Como puede verse, las funciones de Jackendoff son equivalentes a reglas léxicas, las cuáles, en su modelo, actúan sobre la estructura conceptual subyacente a las unidades léxicas dando como resultado una nueva estructura conceptual, sirviendo el mecanismo para dar cuenta de fenómenos semánticos que de otra forma tendrían difícil explicación.

    Jackendoff postula seis funciones, en tres pares complementarios, ejemplificados en (8), (9) y (11). La función PL ya ha sido suficientemente ilustrada; la repito en (8a) únicamente como ejemplo de su aplicación en el campo de la semántica nominal. Su inversa aproximada es la función ELT -por element- (8b) la cual extrae un elemento de una masa o agregado.

    (8)
    a. PL([silla] +D)-D +G = sillas
    b. ELT([arroz] -D +G)+D -G = grano de arroz

    Vemos a continuación en (9) las funciones, también inversas entre sí, COMP (composed) y GR (grinding). COMP, aplicada a una sustancia, da como resultado una entidad individual compuesta de dicha sustancia. Dicha función es responsable de la formación de, p.e. 'casa de madera' por aplicación de COMP a 'madera'; o, como en el ejemplo (9a), de 'un café' -como dosis individual- a partir de 'café' -sustancia-. De modo inverso, GR (9b) aplicada a una entidad individual resulta en una sustancia compuesta de la misma; en el ejemplo, del sentido de 'cordero' como animal se deriva el sentido de 'cordero' como carne.

    (9)
    a. COMP([café] -D)+D = un café
    b. GR([ternera] +D)-D -G = ternera

    La función de grinding (aproximadamente, 'pulverización' o 'triturado'), da cuenta de frases como (10c) y (10d) en la que se utilizan sentidos de masa de 'dog' y 'lamb' derivados de los correspondientes sentidos de animal individual en (10a) y (10b).

    (10)
    a. The car ran over a dog ('el coche atropelló a un perro')
    b. Mary had a little lamb ('Mary tenía un corderito')
    c. There was dog all over the street ('Había perro por toda la calle')
    d. John eats lamb. ('John come cordero')


    Finalmente, las funciones PART (parte) y CONT (contiene) no cambian la estructura interna del sentido léxico sobre el que se aplican. Las utiliza Jackendoff para dar lugar, respectivamente, a partes de entidades delimitadas (11a); y a sustancias que contienen a otra sustancia (11b).

    (11)
    a. PART([mesa] +D)+D = la pata de la mesa
    b. CONT([ternera] -D)-D = estofado de ternera

    Otros elementos de la estructura conceptual: límite, dimensionalidad y direccionalidad

    Jackendoff (1991) postula asimismo la existencia de otros elementos de la estructura conceptual, tales como límite, dimensionalidad perceptual -siguiendo y extendiendo la teoría de Marr (1982) de la codificación de la forma de los objetos-, y direccionalidad. Dichos elementos, junto a los descritos anteriormente (delimitación y granularidad) son susceptibles de intervenir en la esquematización mental de objetos y sucesos (en la línea de los esquemas mentales de Langacker comentados en la sección anterior, con la diferencia que en la hipótesis de Jackendoff los elementos intervinientes en los esquemas son innatos).

    El rasgo de direccionalidad es utilizado para caracterizar trayectorias o caminos dentro de la clase general de 'espacios', así como para diferenciar eventos de estados (trayectorias y eventos son considerados direccionales; espacios y estados, no direccionales).

    Por otra parte, Jackendoff postula que los límites de las entidades se conceptualizan como elaboraciones mínimas (notadas e) de sus límites topológicos ideales, entendiéndose por elaboración mínima la porción tridimensional resultante de extender mínimamente un límite idealizado -que por ser idealizado se entiende como de menos de tres dimensiones: un punto, una línea, un plano-. Así, por ejemplo, 'la punta de la lengua' se concibe como una porción tridimensional correspondiente a la elaboración mínima del punto cero-dimensional que idealmente constituiría el extremo de la lengua; o 'la superficie del mar' como la elaboración mínima del plano (bidimensional) que idealmente constituiría la superficie de cualquier entidad física -en este caso, el mar-.

    En cuanto a dimensionalidad, la hipótesis es que los hablantes conceptualizan objetos y eventos como esquemas n-dimensionales idealizados, p.e. caminos, ríos o lazos son mentalmente esquematizados como líneas (1D); las alfombras como superficies (2D); las naranjas como volúmenes (3D). Un objeto +Delimitado puede asimismo ser idealizado como un punto (0D) -siendo éste el principio que permite representar a las ciudades como puntos en los mapas-. De forma similar, en el campo de los objetos temporales, los accomplishements son 1D -líneas de desarrollo temporal- mientras los achievements son 0D -puntos en el tiempo-.

    La conceptualización de los objetos implicaría además una dimensionalidad secundaria, la de su sección transversal. Así, dos objetos 1D, como un tubo y una cinta, difieren entre sí en que su dimesión secundaria es, respectivamente, una circunferencia (2D) -el tubo- y una línea (1D) -la cinta-. Esto tiene implicaciones en la representación de palabras de límites, ya que, por ejemplo el "final" puede ser tanto una parte 0D de un item 1D (no importa que se hable del "final de una línea" o del "final de una charla"), como una parte 1D de un elemento 2D ("poner el vaso al final de la mesa"). Ello conllevaría la representación, en términos de la semántica conceptual, del concepto "final" como la parte de dimensión n-1 que delimita el eje transversal de una entidad de dimensión n.

    Y aplicando la noción de elaboración mínima comentado anteriormente, se entenderá que el concepto denotado por "el final", se concebirá como la expansión mínima a lo largo del mencionado eje transversal; es decir, obviamente, 'el final de un tubo' o 'el final de una charla' no serán estrictamente entidades espaciales o temporales puntuales ideales, sino una cantidad de tiempo o material lo suficientemente pequeños como para ser representados mentalmente como una parte límite.
 
 

    2.2.2.2 Recapitulación

    Cabe resaltar del modelo de Jackendoff que afronta aspectos interesantes y poco tratados del conocimiento parte-todo subyacente a determinados fenómenos lingüísticos. Destaquemos en primer lugar un tipo muy productivo de relación constitutiva, la alternancia masa/contable, (p.e. 'café [substancia] ' - 'café [dosis] '; 'cordero [animal] - 'cordero [carne] ') que es equivalente a la relación denominada hecho de (término habitual en formalismos de representación del conocimiento) o material-objeto (p.e. en Winston et al., 1987), con la peculiaridad de que en este caso ambos conceptos relacionados, entidad y materia de la cual la entidad está hecha, están denotados por un mismo lexema; lo que por consiguiente implica que se está tratando un caso de polisemia lógica. En segundo lugar cabe destacar el tratamiento de la relación entre conceptos granulares y los elementos de que están compuestos ('arroz'-'grano de arroz'; 'toser[iterativo] '-'toser[puntual] '), así como la visión de la pluralidad como una relación de este tipo.

    Este tipo de fenómenos reciben en Jackendoff (1991) un tratamiento, basado en rasgos conceptuales y funciones, innovador y de gran potencial explicativo, dado que se intuye capaz de dar cuenta de un amplio abanico de casos; más cuando el formalismo es aplicable tanto en el orden espacial (nombres) como en el temporal (verbos). Por otra parte, el modelo de Jackendoff tiene la ventaja de ser altamente formalizable, pudiendo codificarse fácilmente las funciones como reglas léxicas y los rasgos conceptuales como rasgos en estructuras de representación del conocimiento.

    Por añadidura, las nociones de direccionalidad y dimensionalidad esbozadas en el marco genérico de la semántica conceptual, son adecuadas para desarrollar a fondo métodos de representación del conocimiento léxico como la de nombres de límites de entidades. Por ejemplo, pueden codificarse los usos de las palabras 'principio' y 'final' en términos de direccionalidad; o los de las mismas y otras como 'extremo' en función de la dimensionalidad ('final' sería aplicable a entidades conceptualizadas como delimitadas y unidimensionales -en el espacio o en el tiempo-, como 'camino' o 'viaje').

    En el debe de Jackendoff cabe apuntar el hecho de que las funciones no están definidas con la precisión deseable, sino que más bien apuntan una dirección a seguir. Sin duda alguna, ello es achacable a que el modelo se halla aún en fase de desarrollo.

    Como cuestión colateral, a mi juicio, las consideraciones relativas a palabras que denotan límites ('final', etc.) no deberían circunscribirse puramente a límites, sino que deberían ser extensibles, en general, a partes relevantes de esquemas topológicos. Por ejemplo la palabra 'centro' (como en 'el centro del mundo'), tiene un claro potencial de formar sintagmas denotadores de partes de entidades, aunque obviamente no es una palabra 'de límites'.

    Finalmente, no cabe duda que la postulación de los elementos conceptuales como constituyentes mentales primitivos, innatos y universales es una hipótesis (de claro sabor chomskyano) altamente susceptible de ser objeto de polémica y discusión; pero también es cierto que es posible -tal y como será mi postura en este trabajo- prescindir de tales implicaciones psicológicas y tomar el de Jackendoff como un modelo lingüísticamente relevante por sus capacidades formal y explicativa.

 

2.3 Conclusiones


    En este capítulo he presentado diversas aproximaciones teóricas al tratamiento del conocimiento merológico, y las he dividido en dos grandes clases: léxico-relacionales (§2.1) y constructivistas (§2.2).

    Los autores del primer grupo centran la atención de su estudio en el aspecto estructural del problema, tratando las relaciones parte-todo fundamentalmente como una de las relaciones básicas que organizan el léxico de una lengua. Los constructivistas, por su parte, tratan de modo más global sobre la naturaleza de las categorías mentales que, según sus hipótesis, subyacen al conocimiento lingüístico.

    Indudablemente, ambas aproximación no son disjuntas o mutuamente exclusivas. Por ejemplo, el trabajo de Winston et al. (1987), aunque lo hemos englobado en el primer grupo, presenta una propuesta basada en gran parte en la postulación de ciertas primitivas mentales. A su vez, aunque clasificada en el segundo, de la aproximación cognitivista dimanan múltiples conclusiones relevantes para una estructuración relacional del lexicón. En todo caso, la organización del capítulo se ha llevado a cabo atendiendo al centro de atención teórico preferente de cada aproximación: la definición de relaciones léxicas por una parte, y la de los mecanismos de conceptualización subyacentes al conocimiento lingüístico por otra.

    La principal conclusión que se puede extraer de las aproximaciones léxico-relacionales es que la relación parte-todo no es una, sino una familia de relaciones. Éstas tienen en común la expresión de una noción genérica de inclusión, que no ha sido, a mi juicio, definida de un modo totalmente satisfactorio.

    La asunción de la existencia de una multiplicidad de relaciones meronímicas ha derivado en la postulación de diversas clasificaciones de las mismas. De entre todas, la que ha obtenido mayor consenso y aceptación es la propuesta por Winston et al. (1987), en la que se han basado las representaciones computacionales del conocimiento parte-todo de WordNet y EuroWordNet -descritas en el capítulo siguiente-. Sin embargo, dicha clasificación no debe ser tomada como la solución definitiva al problema ya que, como apunta Cruse (1986), múltiples factores relativos a la opcionalidad de las relaciones y la polisemia de los términos relacionados, impiden fijar de modo claro y unívoco el conjunto de relaciones meronímicas.

    En segundo lugar, hemos destacado dos corrientes que centran su atención más que en la estructuración del léxico en los procedimientos y mecanismos mentales que subyacen a ésta: la lingüística cognitiva y la semántica conceptual.

    El cognitivismo, partiendo de los análisis de Rosch (1973), Berlin et al. (1974), Hunn (1977) y Tversky y Hemenway (1984), considera que el conocimiento parte-todo es un mecanismo fundamental en la construcción de las categorías mentales.

    En este modelo no se contrapone la semántica lingüística al conocimiento general, por lo que la organización del significado es vista como un todo indisociable. Por lo tanto, no se define el significado de las unidades léxicas por las relaciones que éstas establecen con otras unidades léxicas, sino que se asume que el significado de cualquier categoría cognitiva se define por las relaciones que establece con otras estructuras cognitivas, independientemente de que dichas categorías puedan o no corresponder a etiquetas léxicas.

    En consecuencia, se postula al efecto la realidad psicológica de un número reducido de esquemas merológicos básicos -para Iris et al. (1988): componente funcional-todo, miembro-colección y segmento-todo; para Lakoff (1987): contenedor-contenido y parte-todo- que pueden realizarse en el lenguaje tanto en forma de unidades léxicas simples como de construcciones complejas.

    La semántica conceptual de Jackendoff tampoco circunscribe el fenómeno parte-todo a una relación entre lexemas, sino que propone la definición de un conjunto de primitivas conceptuales capaces de construir, por aplicación de funciones o mecanismos combinatorios, el conjunto de los conceptos lingüísticos -tanto lexicalizados como sintagmáticos-.

    En este marco, Jackendoff (1991) aborda diversos fenómenos merológicos no tratados, o tratados de modo insuficiente, por las aproximaciones lexicalistas, tales como los nombres de límites, la pluralidad, la expresión de la multiplicidad o las alternancias sustancia-entidad. Por contraposición a la lingüística cognitiva, la semántica conceptual mantiene un alto grado de compromiso con la formalización del conocimiento semántico, por lo que resulta una aproximación de gran valor para el desarrollo de representaciones computacionales.

3. Modelos computacionales


3.1 WordNet
3.2 EuroWordNet
3.3 Representación del conocimiento léxico mediante
estructuras de rasgos tipificadas: LRL-LKB
3.4 Recapitulación


    La representación computacional de la información parte-todo se ha centrado fundamentalmente en la meronimia; es decir, en forma de relaciones entre lexemas en redes semánticas léxico-conceptuales. De entre estas bases de conocimiento, la principal es WordNet (cf. Miller et al. 1990) -para el inglés-, la cual, a causa de su amplia cobertura, se ha convertido de facto en un standard en el campo de la lexicología computacional. Recientemente, siguiendo las líneas básicas de WordNet, se está desarrollando el proyecto EuroWordNet (cf. Vossen, 1995), para la construcción de una red semántica multilingüe de español, holandés, italiano e inglés, en la que también se incluyen relaciones meronímicas.

    No se dispone hasta el momento de un tratamiento computacional de las relaciones merológicas no léxicas, sino únicamente una aproximación, realizada por Vossen y Copestake (1994) utlilizando LRL-LKB, un formalismo basado en estructuras de rasgos tipificadas (Copestake, 1992). Dicha aproximación es un claro antecedente del trabajo que desarrollaré a partir del próximo capítulo. Mi aproximación se formalizará en el marco de la Teoría del Lexicón Generativo (Pustejovsky, 1995), el cual precisamente, como veremos, sirve de base para el diseño de LRL-LKB; en consecuencia, mi aproximación será directamente implementable en este dicho formalismo.

    Lógicamente, el tratamiento de los aspectos no léxicos de la información parte-todo, no puede realizarse en lexicones relacionales como WordNet o EuroWordNet, puesto que para ello se precisa de mecanismos de composición semántica de los que éstos carecen. LRL-LKB, en cambio, no es únicamente (aunque sí fundamentalmente) un formalismo de representación léxica, puesto que tiene asociados mecanismos de combinación de las unidades léxicas a fin de construir representaciones de unidades más amplias: grupos, sintagmas y oraciones. La representación del conocimiento léxico en LRL-LKB, además, es más rica que en WordNet. En este último la representación consiste únicamente en lemas conectados por relaciones léxico semánticas; en cambio, LRL-LKB (como HPSG u otros formalismos de representación del conocimiento lingüístico) codifica para cada entrada información de varios niveles: morfológico, sintáctico, semántico e incluso pragmático, proporcionando así las bases para la composición de unidades lingüísticas complejas.

    Sin embargo, la información codificada en WordNet o EuroWordNet es reutilizable por LRL-LKB u otros formalismos de tratamiento del lenguaje. Su amplia cobertura terminológica y su alto nivel de estructuración relacional convierte a dichas bases de datos en fuentes de innegable valor a partir de las cuales construir un lexicón de LRL-LKB. De forma mas precisa, por una parte, la ordenación jerárquica del lexicón implementada en WordNet es susceptible de ser utilizada de forma directa para la estructuración de las jerarquías léxica y de tipos de un lexicón basado en estructuras de rasgos tipificadas; y por otra, sus relaciones semánticas (p.e., las meronímicas) son codificables en forma de pares atributo-valor en formalismos como LRL-LKB.

    En este capítulo, presentaré en primer lugar WordNet y EuroWordNet y su tratamiento de la meronimia. En segundo lugar, presentaré el sistema de representación de LRL-LKB, con mención expresa de la aproximación de Vossen y Copestake (1994) al tratamiento de la información merológica no léxica.

3.1 WordNet
 


    WordNet es una base de datos léxico-conceptual del inglés estructurada en forma de red semántica -es decir, compuesta de unidades léxicas y relaciones entre ellas-, que pretende ser un modelo del conocimiento léxico-conceptual de los hablantes de inglés.

    WordNet se ha venido desarrollando desde los años 80 bajo la dirección del psicolingüista George Miller en la Universidad de Princeton. La última versión hecha pública es WordNet 1.5, la cual consta de 126.000 entradas entre palabras (el 57%) y grupos lexicalizados (el 43% restante) pertenecientes a las llamadas categorías abiertas: nombres (70%), adjetivos (15%), verbos (10%) y adverbios (5%). Las llamadas categorías cerradas (preposiciones, conjunciones, etc.) no se representan en WordNet pues sus autores consideran que son parte del conocimiento sintáctico de los hablantes, no del conocimiento léxico-semántico que es el que se pretende representar.

    La unidad básica en la que se estructura WordNet es el synset o conjunto de sinónimos, el cual se considera representativo de un concepto lexicalizado. Así, en WordNet, las relaciones se establecen fundamentalmente entre conceptos, no entre palabras, asumiéndose que un concepto viene definido por el conjunto de formas léxicas que, en un contexto apropiado, sirven para representarlo en el lenguaje. Tal asunción implica la de una noción débil de sinonimia, la sinonimia en contexto, una versión laxa de la noción tradicional de sinonimia -atribuida a Leibniz- según la cual dos unidades léxicas son sinónimas si la sustitución de una por la otra no produce en ningún caso alteración del valor de verdad de la proposición en la que aparecen. Como es sabido, atendiendo a dicha noción tradicional de sinonimia, en escasísimas ocasiones podría decirse que dos palabras son sinónimas. Por dicha razón, en WordNet se apuesta por la sinonimia en contexto como solución pragmática y realista que, aunque poco purista y, como veremos, siempre sujeta a matices e interpretaciones, permite afrontar la tarea de representar y tratar computacionalmente el conocimiento léxico-semántico de una lengua.

    Así, las 126.000 entradas de WordNet 1.5 se organizan en 91.000 conceptos o synsets. Por ejemplo, el nombre board, traducible según su sentido por 'tabla', 'mesa' (en su sentido de 'manjar') o 'consejo' aparece en los siguientes synsets:

    (1) {board , plank} 'tabla', 'plancha'
    (2) {board} 'consejo'
    (3) {board, table} 'mesa', 'manjar'

 lo cual debe interpretarse como que board-1 es sinónimo de plank; y board-3 sinónimo de table.

    Como puede verse, el synset no es una unidad explícitamente explicativa de la entidad del concepto, tan sólo es indicativo de la existencia del mismo. Según Miller et al. (1990) el significado en WordNet no es, como en otros planteamientos semánticos, composicional o construido, sino diferencial: el significado de un concepto viene dado por contraposición al del resto de conceptos de la base de datos. Así, el significado del concepto representado en cada caso debe ser inferido del haz de relaciones semánticas en el cual el mismo se halla inmerso. Por ejemplo, el significado de cada sentido de board puede ser deducido en principio a la vista de sus hiperónimos directos, {lumber,timber}('maderaje'), {committee} ('comité') y {fare} ('alimentos'):

    (1) {board , plank} (a stout length of sawn timber; made in a wide variety of sizes and used...)
    HIPERÓNIMO ® {lumber, timber}

    (2) {board}(a committee having supervisory powers; "the board has seven members")
    HIPERÓNIMO ® {committee}

    (3) {board, table} (food or meals in general; "she sets a fine table"; "room and board")
    HIPERÓNIMO ® {fare}

    Como puede verse, la sinonimia y la taxonomía son las relaciones semánticas fundamentales en WordNet 1.5. La sinonimia define los conceptos, o synsets; y la taxonomía los ordena de forma jerárquica. Los nodos superiores de la estructura taxonómica nominal constituyen un conjunto de unos 30 conceptos con los que cualquier entidad del modelo del conocimiento léxico está relacionada (entidad, abstacción, lugar, forma, estado, evento, grupo,...) El resto de relaciones que se hallan en WordNet son las que se detallan en la tabla III.1.

    WordNet 1.5 es una gran red semántica, un modelo del lexicón de los hablantes de inglés en que todas las unidades están interconectadas, de forma que, en principio, cualquier sistema de procesamiento del lenguaje que la utilice, obtiene la posibilidad de realizar una gran multiplicidad de inferencias de significado. Veámoslo, por ejemplo en fig. III.2 un fragmento del lexicón tal como se halla representado en WordNet 1.5. Dicha figura representa un fragmento del léxico relativo a vehículos de motor. Obsérvese como car ('coche'), se halla emparentado por sinonimia con auto ('auto') y taxonómicamente por hiponimia sucesivamente con motor vehicle ('vehículo de motor'), vehicle ('vehículo'), artifact ('artefacto'), object ('objeto'), y con el concepto de orden máximo superior (o top) entitiy ('entidad'); siendo a su vez hiperónimo de ambulance ('ambulancia'), taxi ('taxi') y wagon ('furgón'). Asimismo, car tiene como parte propia blinker ('intermitente').
 

    Relación     Categorías en que se aplica     Ejemplo/s
    Sinonimia     nombres, verbos, adjetivos adverbios     board-plank ('tabla'-'plancha')
    Antonimia     nombres, verbos, adjetivos, adverbios     rise-fall ('ascender'-'caer')
    Hiperonimia-Hiponimia     nombres  board ® committee
('consejo'® comité')
    Meronimias      nombres  trunk ® tree
('tronco'® árbol') 
    tree ® forest 
('árbol'® bosque')
    wood ® lumber, timber ('madera'® 'maderaje')
    Implicaciones     verbos  supply ® give
('proporcionar'® dar')
    divorce ® marry
('divorciarse'® 'casarse')
    snore ® sleep
('roncar'® dormir')
    give ® have
('dar'® tener')
    Similitud     adjetivos  positive - good 
 ('positivo'-'bueno')
    Atributo/Valor     nombres - adjetivos   height - tall    ('altura'-'alto')

Tabla III.1: relaciones en WordNet 1.5


Fig. III.2: Esquema parcial de relaciones en WordNet
 

    En cuanto a las relaciones meronímicas, aunque Miller et al. (op. cit.) anuncian la intención de representar las definidas por Winston et al. (1987), únicamente encontramos tres de ellas implementadas en WordNet 1.5: parte-de (o relación de componente), miembro-de y substancia-de (ver tabla III.2) -la primera de ellas es la única representada en la fig. III.2-.
 

    tipo de meronimia     ejemplo
    part_of      trunk --> tree
    member_of      tree --> forest, wood
    substance_of      wood --> lumber, timber

                                                         Tabla III.2: Relaciones meronímicas en WordNet 1.5

    La primera de ellas relaciona a una entidad con sus componentes, la segunda a un conjunto con sus miembros, y la tercera a una entidad con la sustancia de la que, al menos en parte, está compuesta. Dichas relaciones siguen la definición establecida en Winston et al. (1987) -ver Sección 2.1-.

    Otra relación parte-todo se establece en Wordnet 1.5 entre eventos (denotados por verbos), aunque se halla algo desdibujada porque tal relación no figura de forma explícita sino como subconjunto de una relación: la de entailment -'implicación'-.

    Las relaciones que estructuran la red verbal en WordNet 1.5 son tres: troponimia (o 'hiponimia' verbal), implicación y causación. Todas ellas son de hecho subtipos de implicación, aunque tan sólo una de ellas reciba dicho nombre. Y es precisamente dicha relación la que engloba a dos relaciones de hecho, una de las cuales es la que debe considerarse una relación parte-todo entre acciones. Dicha estructuración de relaciones resulta, pues, algo confusa, por lo que la detallaré a continuación de forma esquematizada con ejemplos (véase fig. III.3).

    Se definen dos formas de implicación, una que presupone inclusión temporal entre los eventos (en el esquema: +inclusión temporal) y otra que no ( - inclusión temporal). A continuación se distinguen dos relaciones de implicación que no presuponen relación temporal: la causación y la presuposición retroactiva. Se da causación cuando la realización de una acción o proceso implica necesariamente la existencia de otro evento, como en el caso de 'dar' ® 'tener': si algo o alguien da algo, el resultado es que necesariamente algo o alguien tiene algo. Por presuposición retroactiva (backward pressuposition) se entiende que la existencia de un evento implica necesariamente la existencia anterior de otro evento de tipo distinto: el que alguien se divorcie implica que ese alguien anteriormente se ha casado.

Fig. III.3: Relaciones verbales en WordNet 1.5
 

    Las relaciones de implicación que presuponen inclusión temporal se subdividen asimismo en dos: troponímicas (+ troponímia) y no troponímicas (- troponimia) -del griego tropos, 'manera'-. WordNet 1.5 toma la troponimia como relación verbal fundamental, y de hecho se entiende como el equivalente para verbos de la hiponimia-hiperonimia. Dicha etiqueta establece una relación de manera entre (verbos que denotan) eventos de modo que un evento X será tropónimo de Y cuando Y es un evento más general que X de forma que X es entendido como una manera particular de realizar Y: por ejemplo, 'dar' es una manera de 'transferir', siendo el evento denotado por 'transferir' de tipo más general que 'dar', ya que existen otras maneras de 'transferir', como 'donar', 'regalar', etc. Ambos eventos se consideran incluidos temporalmente el uno en el otro de forma completa, ya que, p.e., todo el tiempo en que se está llevando a cabo la acción de 'dar', se está llevando a cabo la de 'transferir'.

    Finalmente, la otra relación que implica inclusión temporal es la relación no troponímica de inclusión de eventos. Ésta es la relación que debe ser vista como una relación parte-todo para verbos, y se establece entre dos acciones o procesos cuando como mínimo durante todo el tiempo en que uno de ellos tiene lugar, tiene lugar el otro, pero no existe relación de manera entre ellos. Por ejemplo, si sucede la acción 'roncar', necesariamente ésta se desarrolla durante el tiempo en que sucede la acción 'dormir', pero no necesariamente todo el tiempo en que se duerme se ronca -afortunadamente-.

    Respecto a la transmisión de información meronímica entre conceptos lexicalizados (transitividad de las relaciones y herencia de información), WordNet procede del siguiente modo. Siguiendo las directrices trazadas en Winston et al. (1987) se concluye respecto a la transitividad de la meronimia que dicha relación será transitiva siempre y cuando se mantenga la línea de transmisión dentro de un mismo subtipo. Es decir (ver fig. III.2), si inner tube ('tubo interior del neumático') es parte componente de pneumatic tyre ('neumático') y éste a su vez es parte componente de car wheel ('rueda de coche'), inner tube es parte componente de car wheel. Dicha transitividad no se mantendría en el supuesto de un concepto que se hallara relacionado con cualquiera de los anteriores por un subtipo diferente de meronimia. Supongamos por ejemplo que 'goma' se hallara relacionada como substancia-de inner tube. En dicho caso no se inferiría que 'goma' es parte de car wheel. Ciertamente nuestro conocimiento del mundo nos dice que dicha inferencia sí es posible en este caso, pero debe tenerse en cuenta que, aunque en este caso concreto la inferencia es posible, no lo es en todos los casos posibles, por lo que no puede postularse a nivel general el mantenimiento de la transitividad cuando diferentes subtipos de meronimia se hallan implicados. Por ejemplo, siguiendo la línea transmisoria hasta un nivel superior, es obvio que no necesariamente wheel ('rueda') tiene como parte 'goma', pues p.e. una rueda de carro no cuenta con dicho material en su constitución.

    El segundo aspecto relacionado con la transmisión de información meronímica es la herencia. Se considera en WordNet que las relaciones de parte son heredables por los conceptos via hiponimia. Obsérvese en la fig. III.2 que el único merónimo propio de car es blinker. Sin embargo, el hiperónimo de car, motor vehicle, tiene como merónimos car wheel y cab ('cabina'). Siguiendo el principio mencionado, debe inferirse necesariamente que tanto car como sus hipónimos ambulance, taxi, etc. tienen por parte (por herencia) car wheel y cab.

    Sin duda alguna la mayor virtud de WordNet 1.5 es precisamente el hecho de su existencia: se trata de la única base de datos léxico-semántica relacional en formato máquina de gran volumen, por lo que se ha convertido en una herramienta de utilización cada vez mayor en múltiples trabajos de investigación en lingüística computacional (p.e., en España, aunque para el tratamiento del inglés, Ribas 1994 y 1995, Agirre y Rigau 1996, Atserias et al. 1977, y Rigau prox.) que precisan aplicar o extraer conocimiento léxico-semántico a partir de corpora textuales reales. Pero no carece de defectos. Los principales son dos: el primero, comentado anteriormente, que el status de las relaciones existentes entre pares de unidades léxicas es en muchos casos discutible; el segundo, que en WordNet 1.5 se procude una multiplicación de sentidos de palabras que en muchos casos debe juzgarse como excesiva o inmotivada.

    Un ejemplo de esta última situación relacionado con el tratamiento de las relaciones de parte puede verse a partir de los casos de (12), que muestran tres sentidos en Wordnet 1.5 de la palabra door ('puerta'). En dos de ellos, 1 y 3, (puerta de habitación o edificio vs. puerta de coche) no parece justificable mantener dos conceptos separados. La motivación de tal duplicidad debe hallarse en que, en WordNet 1.5, no es posible representar la holonimia en forma disyuntiva.

    (12)
    1.- {door} (a swinging or sliding barrier that will close the entrance to a room or building)
    PART-OF: {doorway, door, entree, portal, room access}

    2.- {doorway, door, entree, portal, room access} (the space in a wall through which you enter or leave a room or building; the space that a door can close)
    PART-OF: {wall}

    3.- {door} (a swinging or sliding barrier that will close off access into a car)
    PART-OF: {car, auto, automobile, machine, motorcar}

        Es decir, si existen las entidades 'edificio' y 'coche' y resulta que cada una de ellas tiene como parte componente una 'puerta', no es posible dados los recursos de WordNet el representar una única entidad 'puerta' con holónimos disjuntos, 'edificio' y 'coche': la única solución es introducir dos sentidos distintos de 'puerta'.

    Como veremos a continuación, este problema de WordNet se ha intentado solucionar en el diseño de EuroWordNet.

3.2 EuroWordNet
 


    Tomando en gran parte como pauta a seguir WordNet 1.5, se inició en 1996 el proyecto EuroWordNet, que tiene como fin la construcción de una base de datos léxico-semántica que debe constar, al finalizar ésta su fase inicial, en 1998, de 50.000 sentidos nominales y verbales para cada una de las lenguas participantes: castellano, holandés, italiano e inglés. Las redes semánticas de cada una de las lenguas estarán conectadas mediante relaciones de equivalencia a una estructura interlingüística, pudiendo así servir de base para tareas de procesamiento del lenguaje que requieran de información multilingüe, tales como traducción automática o recuperación de información de textos de una lengua por parte de hablantes de otra distinta.

    EuroWordNet propone una mayor riqueza de relaciones semánticas así como diversas soluciones para solventar lo que se ha considerado como deficiencias de WordNet 1.5 y que se han expuesto en la sección anterior: multiplicación inncesaria de sentidos y falta de consistencia en la aplicación de ciertas relaciones semánticas (cf. Bloksma et al. 1996, Climent et al. 1996). A tal efecto se introducen como mecanismos de representación las nociones de conjunción y disyunción de relaciones, con la aplicación que se ilustra a continuación en las fig. III.4 a III.8.

    WordNet 1.5 utiliza de forma circunstancial la conjunción de hiperónimos, ya que existen nodos conectados con varios (generalmente dos) nodos superiores. La conjunción no está marcada explícitamente en WordNet 1.5, sino que es el valor asumido por defecto en los casos en que se da múltiple conexión. En EuroWordNet (EWN) se propone un uso mucho más sistemático de dicho recurso, de forma que así sea posible evitar casos de duplicación innecesaria de sentidos.
 


Fig. III.4: conjunción de hiperónimos
 

    Véase en el ejemplo dispuesto en la fig. III.4 como el uso de dicho recurso permite codificar en la base de datos un único sentido de los conceptos {change of location}, {rise, ascent} y {climb} por el método de conectar el nodo superior, {change of location} como hipónimo conjuntivo de {movement} y {change}, dando así cuenta de que un [cambio de localización] implica necesariamente tanto un [movimiento] como un [cambio] . En WordNet 1.5 la solución adoptada consiste en la existencia de dos sentidos diferenciados para, cada miembro de la cadena {change of location}, {rise, ascent} y {climb}, siendo una cadena hipónima de {movement} y otra de {change}.

    A pesar de usar implícitamente la conjunción, WordNet no hace uso de la noción complementaria de disyunción de relaciones. La introducción de la misma en EWN permite dar cuenta de casos como el ejemplificado en la fig. III.5. En el mismo, a diferencia del caso de la fig. III.4, un concepto como {albino} debe ser considerado como hipónimo de los conceptos {animal} y {planta} dado que, en terminología de conjuntos, los [albinos] están incluídos en el conjunto de los [animales] o bien en el de las [plantas] , pero -nótese la diferencia con el caso ejemplificado en la fig. III.4- no simultáneamente en ambos. Ello conduciría en WordNet 1.5 a la introducción de dos conceptos diferentes, dos sentidos de 'albino', uno correspondiente a los animales albinos y otro a las plantas albinas; en EWN sin embargo, un único sentido conectado de forma disyuntiva con los hiperónimos {animal} y {planta} evita una nueva e innecesaria duplicación de conceptos.
 


Fig. III.5: disyunción de hiperónimos
 

    Dicho recurso es aplicable no sólo a las relaciones taxonómicas sino también a las meronímicas. Recuérdese el ejemplo de (12), en el que WordNet 1.5 introducía sentidos diferenciados para puertas de coches y puertas de habitaciones o recintos. Sin embargo no parece que los hablantes tengan noción de la existencia de tales dos conceptos diferenciados; por el contrario, puertas de coches y puertas de habitaciones parecen ser dos realizaciones alternativas de un mismo concepto. Ello es codificable en EWN usando la disyunción de la relación parte-de: un único concepto de [puerta] es comprendido como parte, bien de habitaciones, bien de coches -o de cualquier otro tipo de recintos susceptibles de tener puertas, los cuáles serán asimismo conectables a {puerta} mediante una relación meronímica disjunta-.
 


Fig. III.6: disyunción de holónimos
 

    De forma simétrica puede expresarse en EWN la relación disjunta de parte basada no en la naturaleza de la parte sino en la del todo. Como puede verse en la fig. III.7, pese a que es plausible postular un único concepto de [avión] , es evidente que existen aviones a hélice y aviones con motor a propulsión -pero no aviones que tengan simultáneamente como partes {motor a hélices} y {motor a propulsión}-. Dichas relaciones de parte alternativas puden nuevamente ser expresadas mediante la aplicación de la etiqueta de disyunción a la relación que parte del concepto denotador del todo ([avión] ).
 


Fig. III.7: disyunción de merónimos-1
 

    El sistema de conjunción y disyunción de relaciones permite además la combinación de ambos recursos, como en fig. III.8, en la que retomando el ejemplo del avión, puede expresarse que todos los aviones tienen como parte {puerta}, y además algunos tienen como parte {motores a hélices} y otros distintos {motores a propulsión}. La aplicación de la conjunción y la disyunción en la fig. III.8 debe ser interpretada como '{avión} tiene por partes {puerta} y X; en dónde X puede ser {motor a hélice} o {motor a propulsión}'.
 


Fig. III.8: Disyunción de merónimos-2
 

    Etiquetado de relaciones: factividad, reversión y negación

    El sistema de relaciones de WordNet 1.5 no permite expresar otro tipo de aspectos de las relaciones léxicas tales como la factividad, la reversión o la negación de relaciones. A fin de conseguir una mayor precisión léxico-relacional se ha considerado aconsejable en EWN dotar al sistema de capacidad para dar cuenta de los mismos. Tal cometido se realiza mediante el etiquetado de relaciones.

    En EWN las relaciones léxicas no son simples constructos unarios sino que además pueden estar etiquetadas mediante un conjunto de rasgos: factivo/no factivo, revertido y negación (en la base de datos codificadas mediante los términos ingleses 'factive/non factive', 'reversed' y 'not'). Ejemplos de la codificación de relaciones con tales etiquetas pueden verse en la tabla III.3 y los comentaremos a continuación.
 

    synset     relación     etiqueta     synset
    matar     causes     factive     morir
    buscar     causes     non-factive     encontrar
    nariz     part       cara
    cara     has_mero_part       nariz
    libro    has_mero_madeof       papel
    papel     madeof     reversed     libro
    castrado     has_mero_part     not     genitales

tabla III.3: relaciones etiquetadas en EuroWordNet
 

    El rasgo epistémico factivo (propuesto por Lyons, 1977) se aplica a las relaciones de causación e indica la necesariedad de la relación, sirviendo para distinguir, por ejemplo, entre 'matar' causa 'morir' y 'buscar' causa 'encontrar'; en el primer caso si alguien mata, necesariamente alguien muere; en el segundo, el que alguien busque puede causar que ese alguien encuentre, pero la relación causa-efecto no es inexorable, sino únicamente posible o probable.

    El rasgo revertido es necesario pues es un requisito de consistencia interna de la base de datos que toda relación tenga su inversa: si existe una relación que indique que 'nariz' es parte de 'cara', necesariamente debe reflejarse que 'cara' tiene por parte 'nariz'. Sin embargo, de modo similar a lo que ocurre con las causaciones, no todas las relaciones reversas pueden considerarse del mismo nivel de factividad. En el caso de la relación meronímica-holonímica 'nariz'-'cara' la relación debe considerarse completamente bidireccional (toda nariz es parte de una cara y toda cara tiene por parte una nariz). Considérese sin embargo la relación existente entre 'libro' y 'papel'; todo libro esta hecho de papel, luego debe postularse la relación meronímica 'libro' es holónimo de 'papel'; sin embargo la relación inversa, 'papel' es merónimo de 'libro' no es del mismo orden, pues no toda la materia denominada 'papel' se utiliza exclusivamente para conformar libros. Tal distinción se codifica en EWN etiquetando la última de las relaciones como revertida. Así pues, la etiqueta revertida se utiliza para distinguir entre las relaciones con base conceptual de las revertidas automáticamente a fin de cumplir con los requisitos de consistencia interna de la base de datos.

    Finalmente, la etiqueta negación se utiliza para expresar explícitamente que una relación no se da, lo cual puede ser útil para distinguir entre conceptos cuya diferencia radique en la ausencia en uno de ellos de cierta característica, por ejemplo entre 'castrado' y el resto de humanos, en dónde 'castrado' se caracterizará por la negación de la existencia de la relación meronímica con 'genitales'.

    Unificación de nombres y verbos

    Otra innovación de EWN con respecto a WordNet 1.5 es la posibilidad de establecer relaciones entre nombres y verbos. Es harto conocido que procesos y acciones, aunque típicamente estén designados por verbos, tambien pueden serlo por nombres. De hecho aproximadamente el 30% de los nombres de WordNet 1.5 no denotan entidades sino acciones, procesos, relaciones etc. Por dicha razón, los conjuntos de nombres y verbos, absolutamente desconectados entre sí en WordNet 1.5, pueden relacionarse en EWN mediante relaciones transcategoriales. Así, pueden relacionarse los conceptos [destruir] y [destrucción] mediante una relación de cuasi-sinonimia, o [destruir] y [construcción] mediante una de cuasi-antonimia.

    En general, practicamente cualquier relación que pueda postularse entre verbos (holonimias y meronimias, excepto sub-eventos, quedan por tanto excluidas) se entiende de modo más general como existente entre eventos; y dado que los eventos pueden ser también designados tanto mediante nombres como mediante verbos, cualquiera de dichas relaciones puede ser establecida, de forma transcategorial entre nombres y verbos. En la fig. III.9 puede verse de que forma las relaciones de hiponimia (marcadas mediante trazo continuo) y sinonimia (trazo discontinuo) producen el efecto de unificación nombre-verbo.
 


fig. III.9: relaciones nombre-verbo de hiponimia y sinonimia
 

    Una ventaja de dicho tipo de aproximación a las relaciones léxicas es que, dado que una misma información puede ser codificada lingüísticamente tanto mediante una oración como mediante un sintagma nominal (compárense los clásicos ejemplos 'los enemigos destruyeron la ciudad' / 'la destrucción de la ciudad por los enemigos'), será posible, utilizando EWN como base de datos, realizar de forma optimizada operaciones de extracción o recuperación de información en los casos en que, como en el ejemplo, una misma información viene codificada mediante estructuras sintácticas distintas.
 

    Nuevas relaciones

    La arquitectura de EWN comprende relaciones no existentes en WordNet 1.5. En la tabla III.4 pueden verse la totalidad de las relaciones semánticas intralingüísticas incluídas (cf. Climent et al., 1996), junto con una breve descripción de las mismas. Las relaciones en minúscula son subtipos de las inmediatamente anteriores en mayúscula. Las relaciones XPOS (acrónimo de cross part of speech ,'transcategoriales') son las que se establecen entre palabras de distinta categoría morfosintáctica. Las abreviaciones para las etiquetas aplicables a cada relación son: d- disyunción, c- conjunción, r- revertida, f- factiva, n- negación.
 

    relación Etiquetas aplicables     ejemplo     descripción
    HAS_XPOS_HYPERONYM     d c r     destrucción > cambiar     hiperonimia transcategorial
    HAS_XPOS_HYPONYM     d r     cambio > destruir     hiponimia transcategorial
    HAS_HYPERONYM     d c r     destruir > cambiar     hiperonimia
    HAS_HYPONYM     d r     cambio > destrucción     hiponimia
    XPOS_NEAR_SYNONYM     r     cambiar > cambio     cuasi-sinonimia transcategorial
    NEAR_SYNONYM     r     cigarro > puro     cuasi-sinonimia
    FUZZYNYM       feudalismo > propiedad     relación indeterminada
    XPOS_FUZZYNYM       feudalismo > poseer     relación indeterminada transcategorial
    ANTONYM     r     construir > destruir     antonimia
    NEAR_ANTONYM     r     construir > destrozar     cuasi-antonimia
    XPOS_NEAR_ANTONYM     r     construcción > destrozar     cuasi-antonimia transcategorial
    INVOLVED     d c r     martillear > martillo     entidad directamente relacionada con un evento
    ROLE     d c r     vino > beber     evento directamente relacionado con una entidad
    involved_agent     d c r     educar > educador     involvement en que la entidad realiza un papel agentivo
    role_agent     d c r     educador > educar     role en que la entidad realiza un papel agentivo
    involved_patient      d c r     examinar > examinando     involvement en que la entidad realiza un papel de paciente
    role_patient     d c r     examinando > examinar     role en que la entidad realiza un papel de paciente
    involved_instrument     d c r     martillear > martillo     involvement en que la entidad realiza un papel de instrumento
    role_instrument     d c r     martillo > martillear     role en que la entidad realiza un papel de instrumento
    involved_location     d c r     comer > comedor     involvement en que la entidad realiza un papel locativo
    role_location     d c r     comedor > comer     role en que la entidad realiza un papel locativo
    involved_direction     d c r     caer > suelo     involvement en que la entidad realiza un papel de origen o destino
    involved_source_direction     d c r     disparo > arma de fuego     involvement en que la entidad realiza un papel de origen
    involved_target_direction     d c r     caer > suelo     involvement en que la entidad realiza un papel de destino
    role_direction     d c r      suelo > caer     inversa de involved_direction
    role_source_direction     d c r     arma de fuego > disparo     inversa de involved_source_direction
    role_target_direction     d c r     suelo > caer     inversa de involved_target_direction
    HAS_HOLONYM     d c r n     nariz > cara     holonimia (genérica)
    HAS_MERONYM     d c r n     cara > nariz     meronimia (genérica)
    member     d c r n     senador > senado     holonimia de inclusión de elemento en conjunto
    has_mero_member     d c r n     senado > senador     inversa de la anterior
    portion     d c r n     mandrugo > pan     holonimia de trozo o fragmento
    has_mero_portion     d c r n     pan > mendrugo     inversa de la anterior
    part     d c r n     nariz > cara     holonimia de parte
    has_mero_part     d c r n     cara > nariz     inversa de la anterior
    madeof     d c r n     papel > libro     holonimia de sustancia, o hecho de
    has_mero_madeof     d c r n     libro > papel     inversa de la anterior
    location     d c r n     oasis > desierto     holonimia de lugar
    has_mero_location     d c r n     desierto > oasis     inversa de la anterior
    CAUSES   d c r n f     matar > morir     causación entre eventos
    IS_CAUSED_BY   d c r n f     morir > matar     inversa de la anterior
    HAS_INSTANCE       ciudad > Barcelona     instancia de clase
    BELONGS_TO_CLASS       Barcelona > ciudad     inversa de la anterior
    BE_IN_STATE

    d c r n

    belleza > bello     estado correspondiente a la posesión de una cierta propiedad
    STATE_OF     d c r n     bello > belleza     inversa de la anterior

tabla III.4: relaciones semánticas en EuroWordNet
 

    Las relaciones en EWN no se definen formalmente, sin embargo, se describen de forma no ambigua mediante tests lingüísticos. A continuación se exponen los tests para las relaciones de las que específicamente trata este trabajo, las relaciones meronímicas nominales.
 

    Descripción de las relaciones nominales parte-todo en EWN

    Tal y como se ha descrito en el capítulo 2 la llamada relación parte-todo no es una única relación sino una familia de relaciones, de las que se han descrito diversos subtipos (cf., p.e. Cruse, 1986; Winston et al.1987). En EWN se ha decidido restringir dichos subtipos a los seis siguientes: relación entre un todo y sus partes constituyentes (part y has_mero_part); relación entre un todo y una entidad-trozo que ha sido separada de él (portion y has_mero_portion); la relación entre un lugar y otro lugar incluído en el primero (location y has_mero_location); la relación entre un conjunto y sus elementos o miembros (member y has_mero_member); y la relación entre una entidad y la sustancia de qué está hecha (madeof y has_mero_madeof. Se mantiene asimismo una relación subespecificada para cubrir los casos que no sean claramente incluibles en las anteriores (has_holonym y has_meronym).

    La descripción de dichas relaciones se realiza mediante tests de aceptabilidad lingüística, los cuales constan de marcos sintagmáticos con variables a sustituir por los pares de palabras o lexías examinadas como candidatas a cumplir la relación, valores de juicio lingüístico sobre la aceptabilidad del sintagma (si -aceptable-, no -no aceptable) y condiciones a cumplir por dichas palabras o lexías.

    En esta sección se ha descrito el modo de representación del conocimiento léxico adoptado en EWN, que sigue la pauta definida por WordNet, ampliando su expresividad en diversos aspectos. Como hemos visto, se trata en ambos casos de aproximaciones léxico-relacionales. Veremos a continuación un modo distinto de representación, el basado en estructuras de rasgos tipificadas.

3.3 Representación del conocimiento léxico
mediante estructuras de rasgos tipificadas: LRL-LKB
 


    LRL (Copestake, 1992) es un lenguaje de representación del conocimiento desarrollado en el marco del proyecto Acquilex para representar una base de conocimiento léxico, LKB. Asimismo, en Castellón (1993) se describe con detalle la LKB y su uso para la codificación y el tratamiento del conocimiento léxico del español. En esta sección presentaré de forma somera dicho formalismo, siguiendo en parte a los autores citados y a Copestake and Briscoe (1995).

    LRL (Lexical Representation Language, 'Lenguaje de Representación Léxica') es un lenguaje basado en estructuras de rasgos tipificadas (Carpenter, 1992) aumentado con reglas léxicas y de composición de signos y herencia por defecto. Como en todo lenguaje de estructuras de rasgos los objetos consisten en asociaciones de atributos y valores. En LRL, además, por basarse en estructuras de rasgos tipificadas, los valores son tipos elegidos de un conjunto bien definido y jerárquicamente estructurado. Un ejemplo de este tipo de formalización puede verse a partir del esquema de la fig. I.8, en donde los valores de los rasgos que definen la estructura del signo léxico gato_1 son tipos previamente definidos.

    LKB (Lexical Knowledge Base, 'Base de Conocimiento Léxico') es la base de conocimiento léxico desarrollada utilizando los mecanismos de LRL. La entrada léxica de LKB es similar a la de HPSG (Pollard y Sag 1987, 1994). Consta de cuatro rasgos mayores: ortografía, sintaxis, semántica formal y semántica léxica, esta última basada en la teoría del Lexicón Generativo (Pustejovsky, 1995). La sintaxis se describe en LKB en términos de gramáticas categoriales, es decir, bien mediante categorías básicas de tipo atómico (p.e., N, V), bien mediante categorías complejas en las que dos categorías se hallan relacionadas por un operador de dirección (p.e. adjetivo = N/N). La semántica formal se describe mediante rasgos correspondientes a un predicado y a sus argumentos, más un índice ontológico del argumento. Respecto a la semántica léxica, describiré con detalle en §6 el marco de representación desarrollado por Pustejovsky; LKB implementa una adaptación del mismo, RQS, mediante una serie de rasgos que pueden ser vistos como conocimiento general asociado a los signos léxicos (p.e. forma, color, constitución, función, etc.).

    Un ejemplo de una entrada de LRL-LKB puede ser visto en (13), la entrada del adjetivo 'blanco'. El rasgo CAT (sintaxis) define el adjetivo en español como un signo N\N, o signo que combina con un nombre que le antecede resultando la composición en un nuevo signo nominal. La semántica formal de 'blanco' descrita en SEM equivale a la fórmula 'entidad(x) Ù blanco(x)'. En dicha descripción se utiliza la reentracia o coindización de valores; como puede verse en el ejemplo, la utilización del símbolo de reentracia [1] indica que el argumento lógico del predicado 'blanco' es idéntico al del nombre. El rasgo ÍNDICE es indicativo del tipo semántico del argumento. Finalmente el rasgo FORMAL:COLOR recibe un valor de tipo blanco (definido en la estructura de tipos).

   (13)

    [ORT: "blanco"
    CAT:     [RESULTADO: n
                    DIRECCION: retroactiva
                    SIGNO ACTIVO: n]
    SEM:     [ÍNDICE: entidad
                    PREDICADO: Ù
                    ARGUMENTO 1: [PREDICADO: nombre
                                                    ARGUMENTO: x = [1] ]
                    ARGUMENTO 2: [PREDICADO: blanco
                                                    ARGUMENTO: [1]] ]
     RQS: [FORMAL: COLOR: blanco]]

    Además de los signos léxicos (nombre, verbo, adjetivo, etc.) se definen también signos complejos (phrasal signs), los cuales se obtienen a partir de la combinación de signos léxicos utilizando los mecanismos de composición de signos de LRL y las reglas definibles en dicho marco. El mecanismo fundamental que se utiliza es el de la unificación de estructuras de rasgos (cf. vid. Shieber, 1986, y Castellón, 1993), aunque otros mecanismos de composición pueden ser definidos mediante LRL. De este modo, LRL-LKB permite no tan sólo la representación del conocimiento léxico sino también el tratamiento de la composición sintáctica y semántica de las expresiones.

    En LRL-LKB opera la herencia monotónica de información para el conjunto de la estructura de tipos, y además la herencia por defecto en el subconjunto de tipos constituido por los signos léxicos (o entradas). La diferencia entre ambos tipos de mecanismos de herencia es fundamentalmente la siguiente: en la herencia monotónica los objetos heredan de los que les son jerárquicamente superiores los rasgos de éstos, pudiendo únicamente realizar dos operaciones:

    (i), acrecentar dicha información con nuevos rasgos (que sean pertinentes);
    y (ii), atribuir a los rasgos heredados valores más específicos que los atribuídos en la estructura más general.

    En cambio, en la herencia por defecto, es posible, por así decirlo, borrar o sobreescribir información presente en el objeto jerárquicamente superior, eliminando valores, o atribuyendo a los rasgos valores de tipo distinto -y no más específico- al de origen.


Fig. III.10: Comparación de sistemas de herencia
 

    Dicha diferencia puede ser ejemplificada como en la fig. III.10. A la izquierda vemos como ambulancia hereda de modo monotónico los rasgos de automóvil, únicamente acrecentando el rasgo PARTES con un nuevo valor aporpiado: sirena y dando a FUNCIÓN un valor (transporte clínico) que es subtipo del presente en automóvil para el mismo rasgo (transporte). En la estructura de la derecha, la aplicación de un mecanismo de herencia por defecto permite el 'borrado' del rasgo maletero en los valores de PARTES para ambulancia, lo cual no sería posible manejando únicamente herencia monotónica.

    Las reglas léxicas son fórmulas que generan una estructura de rasgos a partir de otra estructura de entrada. Su utilidad principal es la simplificación del lexicón de modo que no toda realización alternativa de un signo léxico deba estar presente de forma estática en la base de conocimiento. Así, mediante las reglas léxicas, pueden generarse a partir de las entradas léxicas iniciales, por ejemplo, formas flexivas ('ventana' ® 'ventanas'), derivados morfológicos ('ventana' ® 'ventanita') o extensiones de significado ('ventana' [objeto] ® 'ventana' [abertura] ). Un ejemplo simplificado de regla léxica es el de la pluralización nombres (14).

   (14)

    [IN: [ORT: cadena
            CATEGORÍA: n = [1]
            NÚMERO: singular]]
    OUT:     [ORT: cadena + 's'
                    CATEGORÍA: [1]
                    NÚMERO: plural]]


    La aplicación de la regla de (14) generaría para cualquier entrada nominal en singular una entrada en plural con la misma categoría sintáctica (extremo éste expresado por la reentrancia de los valores del descriptor CATEGORÍA en las estructuras de entrada y de salida) y una ortografía resultante de la concatenación de la cadena original y el grafema 's'.

    Como he apuntado antes, la entrada léxica de LKB se basa en parte en el marco formal propuesto por Pustejovsky (1991, 1995) -que describiré en §6-, aunque existen ciertos matices diferenciales. Por ejemplo los rasgos de la estructura de Qualia son tratados en su mayor parte en LKB como una descripción estática de propiedades, mientras que en Pustejovsky (op. cit.) son vistos como objetos semánticos activos susceptibles de intervenir en los procesos de composición de signos complejos. En todo caso, el lenguaje de representación, LRL, permite expresar -de hecho, implementar- la teoría de Pustejovsky (u otra teoría lingüístico-formal) del modo que se considere conveniente.

    Representación del conocimiento léxico en WordNet y en LRL-LKB

    Indudablemente, LRL-LKB es un formalismo más expresivo que las representaciones léxico-relacionales de WordNet o EuroWordNet, los cuales son subsumibles en el mismo.

    En primer lugar, resulta obvio notar que las representaciones relacionales de WordNet son representables de modo directo mediante estructuras de rasgos como las de LRL-LKB; por ejemplo, la relación meronímica 'car'¬ 'blinker' de la fig. III.2 de §3.1 puede ser expresada como en (15):

    (15)
    car
    [TIENE_PARTE: blinker]

    Pero de hecho, de modo más general, es de destacar que una jerarquía léxico-conceptual como la de WordNet puede ser usada como base para la creación de las representaciones del conocimiento léxico de LRL-LKB. Considérese por ejemplo en la fig. III.11 una parte de la jerarquía de WordNet de la fig. III.2, aquí traducida al español.

    Dado que los nodos de WordNet (los synsets) representan conceptos, que pueden realizarse en diferentes unidades léxicas (sinónimos en contexto, como 'coche' y 'automóvil' para el concepto {coche,automóvil}), dichos nodos pueden ser tomados como tipos del modelo del conocimiento o interpretación del mundo de LRL-LKB -la estructura de tipos-, y los lexemas en que se realizan dichos conceptos como las etiquetas de los signos léxicos que refieren a dichas entidades.


Fig. III.11: Taxonomía al estilo de WordNet
 

    Así, la taxonomía de la fig. III.11 puede ser convertida en la estructura de tipos (recuérdese, entidades del modelo del mundo, no signos léxicos) de fig. III.12, en dónde el nodo {coche,automóvil} de WordNet se representa mediante el tipo [COCHE], independientemente de sus realizaciones léxicas alternativas:
 


Fig. III.12: Estructura de tipos creada a partir de fig. III.11
 

    Asimismo, a partir de la taxonomía de WordNet de fig. III.11 y en relación con la estructura de tipos de fig. III.12 puede crearse la jerarquía léxica de LRL-LKB de la fig. III.13, en dónde la información asociada a los signos expresará, como valor de ÍNDICE, la referencia del signo al correspondiente tipo del modelo del mundo:
 


Fig. III.13: Jerarquía léxica a partir de fig. III.11 y III.12
 

    Por otra parte, en LRL-LKB no es necesario realizar un completo desarrollo en paralelo o casi en paralelo de las estructuras léxica y de tipos. De hecho en los trabajos de Copestake (1992) y Briscoe y Copestake (1995), en aras de una mayor economía de representación, el desarrollo de la estructura de tipos se reduce a los niveles superiores de entidades, en relación a los cuales se describen las propiedades semánticas básicas de los signos que las refieren, dejando para la estructura léxica y la herencia (por defecto) que sobre ella se aplica la expresión completa de la representación semántica de los signos hipónimos. Así por ejemplo, la estructura de tipos de la fig. III.12 se reduciría a la de la fig. III.14:
 


Fig. III.14: Estructura de tipos simplificada, como en Copestake (1992)
 

    En cuanto a los signos léxicos se atribuiría a 'coche' -y a 'automóvil'- una estructura semántica básica, como por ejemplo la de (16):

   (16)
    ['coche'
    RQS:     [IND: coche
                   FUNCIÓN: transporte
                   ORIGEN: artefacto]]

    Y en función de ésta se completaría la estructura semántica correspondiente a los hipónimos léxicos, como p.e. en 'ambulancia' como en (17), en dónde la notación indica que la representación semántica de 'ambulancia' es la misma de 'coche' -luego la hereda- con la salvedad del rasgo FUNCIÓN, que adquiere para 'ambulancia' el valor transporte_clínico.

  (17)
    ambulancia
    <RQS> < coche <RQS> <RQS FUNCIÓN> = transporte_clínico

    La anterior definición formal de la entrada 'ambulancia' generará para el signo la estructura de rasgos de (18):

   (18)
    ['ambulancia'
    RQS:   [IND: coche
                FUNCIÓN: transporte_clínico
                ORIGEN: artefacto]]

    Otra posibilidad en la adaptación de un lexicón de WordNet a una base de conocimiento LKB puede ser la introducción en la estructura de tipos complejos, con el fin de obtener una representación que puede considerarse más adecuada de acuerdo con planteamientos teóricos. Por ejemplo, en el planteamiento de Pustejovsky (1995) -ver §6.1 y mi desarrollo de la semántica de los contenedores en §6.2.4- es deseable reducir la multiplicidad de significados relacionados de una palabra; para ello, la estructura de WordNet de la fig. III.15 puede sufrir una adaptación que, introduciendo un nuevo tipo, contenedor-contenido, permita la reducción de las entradas léxicas como en la fig. III.16.


Fig. III.15: Estructura parcial de WordNet sobre nombres de contenedores
 

    Siguiendo el procedimiento de las fig. III.11 a III.13, la estructura de la fig. III.16 -parte derecha- resultaría en dos entradas léxicas para cada uno de los lexemas 'bol' y 'ponchera', uno con el significado de contenedor (objeto) y otro con el de contenido (porción o cantidad contenida en el objeto). Dado que éste constituye un caso típico de polisema regular (por metonimia, todos los nombres de contenedor pueden denotar también el contenido), puede introducirse un tipo complejo contenedor-contenido -ver parte izquierda de fig. III.16- al que se atribuyan las características semánticas apropiadas que den cuenta de dicho comportamiento polisémico, situando a continuación en el plano léxico a los lexemas denotadores de contenedores de modo que hereden tales especificaciones:
 


Fig. III.16: Adaptación de la estructura de Fig. III.15 a las estructuras de tipos y léxica de LKB
 

    En todo caso, la relación entre las representaciones tipo WordNet y las de LRL-LKB debe ser vista del modo antes sugerido: las segundas subsumen a las primeras, y un lexicón estructurado al modo WordNet puede ser usado como pauta o punto de partida para la realización de una base de conocimiento más estructurada como LRL-LKB. Por otra parte, como he comentado antes, LRL-LKB permite aplicar mecanismos de composición sintáctica y semántica a las entradas léxicas, construyendo así estructuras denotadoras de expresiones complejas. A los efectos de este trabajo, mediante LRL-LKB es posible dar cuenta de la información merológica, tanto si se realiza léxicamente como si se realiza, como en el caso de los sintagmas partitivos, sintagmáticamente -lo cual no es posible mediante un formalismo como el de WordNet-. Asimismo, como se verá en §7, el mecanismo de reglas léxicas resultará ser altamente explicativo en la tarea de definir las posibilidades combinatorias de los nombres partitivos. Por otra parte, la elección para este trabajo de LRL-LKB frente a otros formalismos similares es debida a que en este formalismo se han implementado -de forma no completa pero sí suficiente, y en todo caso ampliable en los aspectos necesarios- las representaciones propuestas por Pustejovsky (op. cit.), las cuales constituyen el marco formal en el que desarrollaré el núcleo central de mi trabajo.

    Aproximación a la merología en el marco de LRL-LKB

    La única aproximación al conocimiento parte-todo en el marco de LRL-LKB la han llevado a cabo Vossen y Copestake (1994) al tratar la recuperación automática de información léxica para la base de conocimiento a partir de diccionarios. En dicho trabajo no se trata la información meronímica ni se ofrece un tratamiento general de la composición del significado mediante sintagmas partitivos, pero sí se realiza una primera aproximación a la representación del significado de los nombres partitivos.

    En la construcción de las entradas léxicas de la LKB a partir del análisis de las definiciones de diccionarios llevado a cabo en el proyecto Acquilex -en el que se enmarca el trabajo de Vossen y Copestake- la metodología habitual implica definir la estructura de un lexema dado de modo que herede la especificación semántica del lexema que, en la definición de diccionario, sea analizado como genus. Por ejemplo, a partir de una definición como la de (19), la entrada léxica de 'taxi' se declararía de modo que heredara las principales características semánticas de 'coche'.

(19) taxi: coche de alquiler provisto de un taxímetro (Casares, 1959)

    Sin embargo, la existencia de entradas de diccionario como las de (20) no permiten la aplicación directa del método habitual, ya que el genus aparente es un nombre o una construcción partitiva:

(20)
a. root 1 : the part of a plant that...
    (raíz 1: la parte de la planta que...)

b. meal 1 : an amount of food eaten at one time.
    (comida 1: una cantidad de alimento consumida de una vez)

    Centrándose en patrones como los de (20b), cantidades de nombres de masa, los autores concluyen que dicho tipo de patrones 'producen un individual a partir de un genus que denota una masa, describiendo la manera en que dicha entidad resulta individuada'. Y postulan los siguientes efectos de representación en LKB:

    (i) la nueva entrada pertenecerá al tipo que expresa entidades individuales (en su sistema el tipo lex-count-noun, nombre contable) en lugar de al tipo que expresa masas (lex-uncount-noun, nombre incontable);

    y (ii) la nueva entrada heredará la totalidad de la estructura de qualia del genus excepto el rasgo FORM el cuál será el especificado por el patrón denotador de porción.

    De este modo, al entrada para 'meal_1' deducida a partir de su definición (20b) será la de (21), en dónde se indica que a la estructura de 'meal_1' se le atribuye el tipo de nombre contable, y hereda la estructura semántico-léxica de 'food' ('comida') con excepción del rasgo QUALIA:FORM:RELATIVE, el cual recibe para 'meal_1' el valor portion (porción) -el valor de QUALIA:FORM para 'food' sería mass (masa)-.
 

    (21)
    meal _1
    lex-count-noun
    < QUALIA > < food L_0_1+2 < QUALIA >
    < QUALIA : FORM : RELATIVE > = portion.


La idea básica subyacente a este tratamiento es equivalente en principio a una parte de la que desarrollaré en mi representación de los partitivos, es decir, la aplicación de un nombre partitivo a un nombre de masa produce un grupo denotador de una entidad individual. Sin embago, como veremos, muchos otros aspectos de la semántica de este tipo de construcciones deben ser tenidos en cuenta para obtener una representación adecuada: en general, ni toda la estructura semántico-léxica del nombre del todo puede ser heredada de modo simple por la construcción partitiva, ni todas las construcciones partitivas de porción se aplican necesariamente a nombres de masa (ver capítulos §6 y §7).

3.4 Recapitulación


    En este capítulo he presentado los principales formalismos de representación computacional que han tratado las relaciones merológicas desde el punto de vista léxico-relacional, WordNet y EuroWordnet, y el formalismo de representación del conocimiento en el que desarrollaré mi trabajo, LRL-LKB, mostrando que este último es más expresivo que los primeros, dado que:

· permite la representación separada e interrelacionada de, por una parte el conocimiento lingüístico asociado a los signos, y por otra del modelo (interpretado) del mundo de referencia;

· incorpora distintos tipos de mecanismos de descripción y representación (estructuras de rasgos tipificadas, reglas léxicas, herencia por defecto) permitiendo una definición más adecuada del conocimiento léxico-semántico;

· permite la composición de los signos léxicos con el fin de obtener signos complejos (grupos, sintagmas, oraciones), por lo que no es simplemente un formalismo de representación léxico-semántica sino un entorno de tratamiento general del lenguaje.

    Por último, el conocimiento léxico contenido WordNet y EuroWordNet, aparte de ser representable íntegramente en LRL-LKB, podrá ser tomado como fuente de conocimiento que servirá de base para la construcción de representaciones lingüísticas más complejas mediante este último lenguaje de representación.

4. Análisis del problema


4.1 Lexicalización, individuación y categorización
4.2 Propuesta de definición de los tipos de relación parte-todo
4.3 Recapitulación


    El trabajo que voy a desarrollar se centra en la representación formal para sistemas de procesamiento computacional del lenguaje del conocimiento parte-todo inherente a determinadas estructuras nominales del español; con atención preferente a la representación semántica de los grupos nominales partitivos.

    Ante todo, debe recordarse el planteamiento formulado en § 2, en el que anunciaba la asunción del marco general relativo a que el objeto de la denotación de las emisiones lingüísticas no es una entidad del mundo, sino un objeto abstracto intermedio entre las expresiones y dichas entidades: su significado o el concepto. Por otra parte he asumido, a partir de los postulados generales de Frege que el mundo de las entidades que es objeto de referencia no es en puridad el mundo de las entidades reales o perceptibles directamente a través de los sentidos, sino una clasificación o categorización del mismo. Y en consonancia con los postulados del cognitivismo, asumiré que dicho mundo de referencia es de orden mental: el modo que tienen los hablantes de aprehender, interpretar o representar el mundo exterior en sus mentes. Dicho mundo puede incluir entidades abstractas, imaginarias, o, en general, pertenecientes a mundos posibles.

    En el trabajo de modelización semántica que desarrollaré aquí, las estructuras abstractas -expresadas en términos de estructuras de rasgos- que se propondrán deberán ser entendidas como un modelo del concepto o significado de los signos lingüísticos. Las mismas tienen referencia a entidades del modelo (interpretado y categorizado) del mundo. Se asume asimismo que dichos constructos (signos, conceptos, modelo del mundo) constituyen un modelo del conocimiento convencional compartido por los hablantes de una lengua, en este caso el español.

    Las anteriores asunciones y la utilización en este trabajo de postulados de escuelas mentalistas -la gramática cognitiva y la semántica conceptual- se fundamenta en su potencial explicativo de hechos lingüísticos. En consecuencia las estructuras formales que propondré deberán ser tomadas únicamente como un modelo tratable computacionalmente del conocimiento semántico asociado a los signos, nunca como un modelo de la mente.

    Sentado lo anterior, en primer lugar habrá que constatar que la información relativa al conocimiento parte-todo se realiza en el lenguaje tanto de forma estrictamente léxica -como parte de la información asociada a un lexema-, como en estructuras multiléxicas -como parte de la información asociada a un grupo nominal-.

    De forma más precisa, -siguiendo los postulados de la gramática cognitiva y la semántica conceptual- partiré de la asunción de que los diversos tipos de información que denominamos información parte-todo son relativos a (la conceptualización de) fenómenos de inclusión entre categorías; y las categorías pueden ser designadas tanto mediante un único lexema como mediante una expresión compleja.

    A efectos de representación formal, en cualquiera de ambos casos el conocimiento parte-todo debe estar reflejado en la correspondiente representación lingüística, sea ésta la de una entrada léxica o la de un grupo nominal -obtenido a partir de la composición de unidades léxicas-. Por consiguiente la relación parte-todo se reputará como una relación entre categorías, indiferentemente de que se realicen de modo léxico o sintagmático.

    En el caso de las categorías lexicalizadas la información parte-todo será considerada como inherente a la propia entrada léxica, como en los modelos de Winston et al. (1987); Miller et al. (1990); o Cruse (1986). En el caso de las no lexicalizadas, la información parte-todo deberá ser de algún modo aportada al sintagma a partir de la composición de las unidades léxicas que lo forman -siguiendo el principio general de que el significado de un sintagma es una función del significado de las unidades que lo componen-.

    La información relacional parte-todo será expresada en la estructura formal como uno de los rasgos de la misma: un atributo indicativo del tipo de relación, más un valor de dicho atributo indicativo de la entidad del modelo semántico que es el objetivo dicha relación. Se entiende que la relación se establece entre la entidad referida por el signo en cuestión y la entidad expresada por el valor del rasgo.

    Supongamos el caso de 'mobiliario', cuya entrada léxica tendrá una representación similar a la de (22):

    (22)
    [mobiliario
    PARTE_TODO: ELEMENTOS: mueble]

    De igual modo, el grupo nominal 'montón de muebles' deberá obtener (a partir de la composición de las representaciones de 'montón', 'de' y 'muebles') una representación equiparable a dicho respecto, como en (23):

    (23)
    [montón de muebles
    PARTE_TODO: ELEMENTOS: mueble]

    El tipo información representada en (22) -extensible a la representada en (23)- ha sido ampliamente tratada en las aproximaciones léxico-relacionales descritas en §2.1, debiendo únicamente precisarse, a partir de las diferentes propuestas, qué subtipos de relación serán utilizados, y adaptar el modo de formalización relacional al formalismo de estructuras de rasgos.

    En cambio, no se han desarrollado hasta el momento los mecanismos para la composición semántica que dé lugar a representaciones como las de (23). Únicamente Vossen y Copestake (1994) realizan una primera aproximación, y antes Jackendoff (1991) trata el problema de forma genérica; pero sin entrar en el aspecto compositivo del problema ni abordando todos los tipos de información semántica que el mismo comporta. En consecuencia, mi principal objetivo en este trabajo será precisamente el desarrollo del marco teórico que permita obtener la representación del conocimiento merológico subyacente a sintagmas partitivos como el de (23). A esta tarea dedicaré el próximo capítulo y los subsiguientes.
 

    Algunos problemas por resolver en el tratamiento computacional del lenguaje

    Los sistemas de inteligencia artificial son modelos que simulan las capacidades de la mente humana. De entre ellos, los sistemas de procesamiento del lenguaje natural, tienen el objetivo de reproducir, de forma parcial y dependiendo de los objetivos concretos de cada aplicación, las capacidades asociadas al conocimiento lingüístico.

    Tomemos en consideración algunos aspectos de las mismas que guardan relación directa con el conocimiento parte-todo y la individuación de entidades mediante el lenguaje.

    Los sistemas de extracción de información, las interfaces, y en general prácticamente cualquier otro sistema que deba afrontar algún tipo de tratamiento del significado lingüístico tiene necesidad de incorporar módulos de representación estructurada del conocimiento. El procedimiento habitual se basa en la definición de un modelo del mundo o ámbito de actuación del sistema, compuesto de objetos o entidades del dominio, los cuales, a partir de la colaboración con otros módulos del sistema, se integrarán en objetos complejos -p.e., formas lógicas o estructuras atributo-valor- representativas de unidades complejas y estructuradas de significado.

    Un problema que deben afrontar dicho tipo de sistemas es el dimanante de que, en los textos de los cuales se debe realizar una representación semántica, no siempre el conocimiento se halla plasmado de forma explícita.

    En general, en las realizaciones del lenguaje, puede distinguirse entre conocimiento explícito y conocimiento implícito. El primero dimana de forma directa por las unidades léxicas utilizadas y de su estructuración lingüística; mientras que el segundo debe ser inferido a partir de información -no presente en el texto- asociada a las mismas.

    Simone (1990) ilustra este problema, en el que una determinada información implícita debe ser inferida a partir de información asociada a determinadas unidades léxicas del discurso (en este caso, precisamente, información parte-todo), mediante el siguiente párrafo de The Dead de Joyce:
 

    Lily, the caretaker's daughter, was literally run off her feet. Hardly had she brought one gentleman into the little pantry behind the office on the ground floor and helped him off with his overcoat, that the weezy hall door bell clanged again and seh had to scamper along the bare hallway to let in another guest. It was well for her she had not to attend to the ladies also. But Miss kate and Miss Julia had thought of that and had converted the bathroom upstairs into a ladie's dressing room.

    ["Lily, la hija del encargado, tenía los pies literalmente muertos. No había todavía acabado de hacer pasar a un invitado al cuarto de desahogo, detrás de la oficina de la planta baja, para ayudarlo a quitarse el abrigo, cuando de nuevo sonaba la quejumbrosa campana de la puerta y tenía que echar a correr por el zaguán vacío para dejar entrar a otro. Era un alivio no tener que atender también a las invitadas. Pero Miss Kate y Miss Julia habían pensado en eso y convirtieron el baño de arriba en un cuarto de señoras".
 

    Los Muertos en Dublineses, trad. de G. Cabrera-Infante en Alianza Editorial, Madrid, 1974, p. 167

    Existen en el párrafo multitud de mecanismos lingüísticos de cohesión textual; sin embargo, el que nos interesa aquí está señalado por las unidades léxicas subrayadas, todas las cuales refieren a partes de una entidad no mencionada en el texto: una casa. La aparición progresiva de dichos nombres de parte activa en el lector un sistema de expectativas y corroboraciones que resultará en la interpretación de que la escena que se describe sucede, aunque no se designe abiertamente, en el interior de una casa. Para tratar dicho tipo de inferencias, es necesario que el lexicón de un sistema de procesamiento computacional del lenguaje esté dotado de relaciones que pongan en correspondencia 'casa' o 'edificio' con 'oficina', 'baño', 'zaguán', etc.

    Por otra parte, comparando el párrafo de The Dead con su traducción al castellano puede observarse otro fenómeno, el de las diferencias de lexicalización de conceptos en lenguas diferentes, problema éste que debe ser afrontado por otro tipo de sistemas de procesamiento del lenguaje: los de traducción automática.

    Por ejemplo, la palabra inglesa pantry es traducida en el texto como 'cuarto de desahogo'. Posiblemente la traducción no sea muy exacta, pero como mínimo es indicativa de la evidencia de que no existe en castellano una palabra específica a la que traducir pantry -como por el contrario si existe para hallway ('zaguán') o bathroom ('baño')-.

    Los sistemas de traducción automática deben lidiar constantemente con dicho tipo de problemas, los cuales afectan como mínimo de las dos maneras siguientes a las relaciones parte-todo:

    (i) Se dan casos en que una parte de una entidad se halla lexicalizada en una lengua, pero no en otra, con lo que la palabra que denota dicha parte en la primera lengua debe ser traducida por una construcción partitiva en la segunda;

    (ii) Se dan casos de diferencias de lexicalización en los propios nombres partitivos.

    El primer caso se hace evidente a partir, por ejemplo, de pares de traducción de lenguas con estructura similar, como el español-inglés (24a), y de forma diferente en casos de lenguas más disimilares como las lenguas con clasificadores (como el japonés) en relación a lenguas sin clasificadores (español, inglés) (24b), en los que se da el caso añadido de que la construcción partitiva está escondida en la 'lengua con clasificadores' en forma de afijos.

    (24)
    a. mueble     piece of furniture [lit: elemento de mobiliario]
    b. tsunokagu     piece of furniture [tsu = piece; no=of; kagu=furniture]

    El caso (ii) puede observarse a partir de pares de traducción de construcciones partitivas castellano-inglés, como puede verse en los ejemplos (25a-d) en los que el término inglés 'slice' debe ser traducido a diferentes términos españoles ('raja', 'loncha', 'rebanada', 'rodaja') debido a una mayor precisión en las restricciones selectivas del término español. Por otra parte, en (25e,f) un partitivo español simple debe se traducido por un grupo complejo en inglés, dado que el término español incorpora ciertas predicaciones de tipo adjetival no denotadas por su contrapartida léxica en inglés ('escalope' --> [filete] +[rebozado] ; 'rodaja' --> [rebanada] +[redonda] ).

    (25)
    a. a slice of watermelon    una raja de sandía
    b. a slice of ham     una loncha de jamón
    c. a slice of bread     una rebanada de pan
    d. a slice of orange     una rodaja de naranja
    e. un escalope de ternera    a beef steak fried in batter
    f. córtalo en rodajas    cut it in round slices

    Otro tipo de efectos relacionados con las construcciones partitivas incluyen los ejemplificados en (26), los cuales son ejemplo de cómo, en una determinada lengua (o cultura asociada) ciertos nombres partitivos llevan asociada por defecto una determinada interpretación del todo del que son parte individuada. En los ejemplos, mientras por una parte la palabra española 'jarra' implica por defecto un contenido del tipo [cerveza] , de forma simétrica el término inglés 'pint' tiene la misma implicación. En ambos casos, la traducción del término deberá suplir la elipsis, especificando el todo al que el partitivo refiere:

    (26)
    a. Me tomaré una jarra <--> I'll drink a mug of beer / I'll drink a beer
    b. I'll drink a pint <--> Me tomaré una pinta de cerveza / Me tomaré una cerveza

    Por otra parte, la composición de los nombres partitivos con sus complementos comporta la creación de un nuevo objeto lingüístico, la construcción partitiva, el cual tendrá unas propiedades semánticas que dependerán en diferentes grados de las de los signos de origen. Ya hemos visto un aspecto del problema en §3.3, relativo a la recuperación de información léxica a partir de definiciones de diccionario. Como muestra el trabajo de Vossen y Copestake (1994), sucede en muchos casos que las entradas nominales son definidas mediante construcciones partitivas (p.e. 'andrajo: pedazo o jirón de ropa vieja'); en consecuencia la especificación semántica de la entrada en cuestión debe ser deducida en función de las especificaciones semánticas del partitivo y de su complemento.

    El tratamiento de dicho tipo de composición es más complejo que en el caso habitual de composición de nombres con sus complementos preposicionales (p.e. 'casa' + 'de Juan' --> 'casa de Juan'), en dónde las propiedades semánticas del sintagma resultante serán fundamentalmente las del núcleo del mismo, con alguna subespecificación aportada por el significado del complemento. En las construcciones partitivas, por contra, en algunos casos parecen predominar las propiedades semánticas del partitivo y en otras las del complemento (o todo de referencia). Considérense los siguientes casos:

    - La especificación semántica de una entidad parece sufrir variaciones al aparecer el nombre que la denota englobado en una construcción partitiva, lo que puede afectar directamente a las restricciones selectivas de los verbos que pueden combinar con dichos nominales. P.e. (en principio) no puede doblarse el 'acero', pero sí puede doblarse 'una lámina de acero'; o es posible sumergirse en 'el mar', pero no en 'la superficie del mar'.

    - Sin embargo, en otros casos, las propiedades semánticas del complemento predominan sobre las del nombre partitivo. P.e. es posible comer 'un plato de sopa' porque la sopa -y no el plato- es comestible.

    - El cambio de tipo semántico de una construcción partitiva con respecto al del nombre del todo englobado en la construcción puede asimismo afectar a la interpretación de verbos de contenido semántico infraespecificado, como en el caso del verbo catalán 'fer' ('hacer'), el cual recibirá interpretaciones semánticas diferentes al combinar, respectivamente, con 'pa' ('pan') o con 'llesques de pa' ('rebanadas de pan'). En el primer caso, 'fer pa' ('hacer pan') se interpretará como acto de creación de un artefacto; en el segundo, 'fer llesques de pa '('hacer rebanadas de pan') será sinónimo de 'cortar'.

    - Asimismo, la especificación de las restricciones selectivas de los nombres partitivos puede jugar un papel importante en tareas de procesamiento del lenguaje como la ambigüedad en la adscripción de sintagmas preposicionales, la resolución de anáforas o elipsis, o la discriminación de sentidos. Por ejemplo, el conocimiento de que un nombre de contenedor, 'vaso', usado como partitivo, combina de forma preferente con líquidos, ayudará a atribuir a 'vaso' una interpretación no partitiva, sino de objeto físico, en el sintagma 'un vaso de cristal'.

    El tratamiento de este tipo de problemas requiere de los sistemas de procesamiento del lenguaje el disponer de un componente léxico capacitado para que a partir de él se puedan realizar las inferencias y computaciones apropiadas para resolverlos. La definición de dicho componente léxico, en lo que atañe a la información nominal parte-todo e información relacionada, especialmente por lo que respecta a la denominación de entidades mediante grupos partitivos, es el principal objetivo de este trabajo.

    A fin de avanzar en dicha dirección, en este capítulo, tras un análisis del tema de la lexicalización y la individuación de entidades (§4.1), procederé en §4.2 a la definición de los tipos de relación parte-todo a utilizar en la representación tanto de los conceptos léxicos como de los sintagmáticos. El aspecto concreto de la individuación mediante sintagmas partitivos será abordado en profundidad en el capítulo siguiente.

4.1 Lexicalización, individuación
y categorización


4.1.1 Categorización, individuación y lexicalización como funciones de correspondencia
entre niveles semánticos
4.1.2 Individuación y cuestiones relacionadas
4.1.3 Lexicalización y grupos partitivos


La escuela cognitivista (ver §2.2) postula que el conocimiento semántico es indisociable del conocimiento general. Las representaciones formales que desarrollaré en este trabajo se fundamentan en la asunción de dicha hipótesis; en concreto asumo que el conocimiento léxico-semántico denominado meronimia -relaciones de parte existentes entre palabras- no es un tipo de conocimiento aislable sino un aspecto de una capacidad más general de los hablantes: el conocimiento o la capacidad de conceptualización de varias relaciones de inclusión susceptibles de ser establecidas entre categorías de entidades (merología).

    En consecuencia, a partir de dicha hipótesis, como he anunciado anteriormente, las relaciones de inclusión que se representarán lo serán, no entre signos léxicos, sino entre entidades del modelo.

    Dado que, como ya se ha sugerido, y más adelante trataremos, una entidad puede ser designada tanto mediante una única palabra (concepto léxico) como mediante una expresión compleja (concepto sintagmático), una determinada relación merológica entre dos entidades puede realizarse lingüísticamente como una relación tanto entre lexemas como entre sintagmas (o una combinación de ambos). Un ejemplo de tal situación puede observarse a partir de (27). En (27a) la interpretación anafórica de que 'yugular' remite a 'terneros' será inferible a partir de una relación parte-todo entre [yugular] y [ternero]. La misma interpretación en (27b) debe inferirse a partir de una relación parte-todo entre [yugular] y [cabezas de ganado].

    (27)
    a. Los lobos mataron doce terneros. Les destrozaron la yugular a mordiscos.
    b. Los lobos mataron dos cabezas de ganado. Les destrozaron la yugular a mordiscos.

    Las representaciones formales que desarrollaré están dirigidas a permitir inferencias de dicho tipo y otros similares; por ejemplo, en casos como (27), dirigidas a permitir la asimilación semántica entre [cabeza de ganado] y [animal] de modo que las relaciones merológicas de este último concepto lexicalizado sean aplicables a las del concepto denotado por el grupo nominal partitivo.

    Ambos objetos semánticos deben recibir una representación análoga debido a que ambos son modos de individuación lingüística de una misma entidad del mundo. La única diferencia radica en que, mientras un concepto ([animal] ) es léxico, el otro ([cabeza de ganado] ) no lo es.

    Categorización, lexicalización e individuación, sus similitudes y diferencias, y la relación que guardan entre sí, son aspectos de la semántica léxica que no suelen ser abordados, quizá por considerarse que resulta innecesario o que se trata de cuestiones obvias. Sin embargo, creo que es conveniente como cuestión previa dedicar algo de espacio a la tarea de intentar definir la relación que guardan entre sí dichos conceptos.
 

4.1.1 Categorización, individuación y lexicalización como funciones de correspondencia entre niveles semánticos

    Categorización, individuación y lexicalización son tres términos que parecen designar nociones similares, o relacionadas. Mi interprestación es que se trata de funciones de correspondencia entre niveles ontológicos distintos.

    En gramática cognitiva, corriente que introduce el término categorización, no suele precisarse si las categorías, los elementos a partir de los cuales se organiza el pensamiento y el lenguaje, corresponden a lexemas. Sin embargo, el tono general del discurso y los ejemplos utilizados, así parecen indicarlo. Es habitual en GC el abordar la naturaleza de las categorías de color (categorías [rojo] , [verde] , etc.); de las implicaciones entre las categoría [árbol] , [bosque] y [arbusto] ; o de la relación entre las categorías [ave] , [animal] , [ruiseñor] y [pingüino] . Todos ellos, como se ve, conceptos correspondientes a una palabra en el lenguaje -habitualmente del inglés, lengua que manejan los principales autores en dicho campo-, lo que puede llevar a inferir que el término categoría es aquello que corresponde en el lenguaje a unidades léxicas simples.

    Sin embargo, esta correspondencia no se declara nunca de forma abierta. Sin duda porque, aunque las categorías lexicalizadas parecen ser los mejores ejemplos de categorías, existe la asunción implícita de que no todas las categorías están lexicalizadas. Lakoff (1987), por ejemplo, habla de que también el conocimiento lingüístico se organiza alrededor de categorías (lingüísticas), por lo que cabe pensar en categorías como como [frase] , [sintagma nominal] , [nombre] o [nombre propio] . Como se ve, [sintagma nominal] y [nombre propio] no son conceptos que se expresen en castellano o en inglés mediante un lexema simple; de lo que debe inferirse que, en el margo de la GC, no necesariamente las categorías mentales corresponden a categorías léxicas.

    Sin embargo, sí que puede deducirse la existencia de una fuerte tendencia a la lexicalización de las denominadas categorías mentales: la mayoría de los ejemplos de categoría mental corresponden a lexemas; y las que no, corresponden a grupos notablemente lexicalizados ('sintagma nominal', 'nombre propio').

    Esto por lo que atañe a la relación entre categorización y lexicalización. Por lo que respecta a la individuación (o extracción o delimitación de entidades individuales a partir del continuum del mundo de referencia), tal noción puede confundirse con la de categorización en cuanto es un modo de agrupar un conjunto de referentes bajo una misma denominación. La diferencia, sin embargo, es que mientras la categorización debe entenderse en el marco del sistema conceptual, la estación de término de la individuación es, como la de la lexicalización, al ámbito de la realización lingüística.

    En consecuencia, situándome en un marco cognitivista, distinguiré entre los tres términos a partir de un triángulo mundo<--> sistema_conceptual<--> lenguaje, al estilo de la fig. I.4, en el que se entiende por mundo el mundo real y por sistema conceptual el de las categorías mentales (o clasificación del mundo real), incluyendo lenguaje tanto el significante como el significado de los signos y expresiones. Categorización, individuación y lexicalización deben ser entendidas como funciones que ponen en correspondencia objetos pertenecientes a alguno de dichos polos: entidades, categorías (o conceptos) y signos lingüísticos (léxicos o complejos), tal como se muestra en el esquema de la fig. IV.1.

    Tomemos el ejemplo de los gatos. En el mundo de referencia existe una serie de entidades perceptualmente muy similares (se aprecia en ellas un alto grado de regularidad respecto a estructuración, aspecto, tamaño, modo de actuación, etc.), lo cual es el detonante para su clasificación en una única categoría, [gato] . Esta correspondencia entre entidades del mundo y categorías del sistema conceptual es la categorización.
 


Fig. IV.1: Funciones de correspondencia
 

    La convención lingüística, u otros mecanismos, motiva que dicha categoría mental sea expresada genéricamente en el lenguaje mediante un signo léxico simple: 'gato'. Esta correspondencia entre entidades del sistema conceptual (categorías, conceptos) y lexemas es la lexicalización.

    Finalmente, un número cualquiera de dichas entidades del mundo de referencia es expresable en el lenguaje de diversos modos ('doce gatos', 'un gato siamés', 'Micifuz', 'ése', 'los gatos' -genérico-, etc.). Esta correspondencia entre entidades y expresión lingüística discreta es la individuación.

    En puridad, pese a lo que parece interpretarse en la fig. IV.1, la función de individuación no es, evidentemente (en un modelo mentalista), una relación directa entre mundo y lenguaje; sino que se halla mediada por el nivel conceptual: la individuación de entidades se realiza necesaria e inevitablemente utilizando categorías conceptuales. Por ello, el diagrama de fig. IV.1 debe entenderse, de modo más exacto, como en fig. IV.2.


Fig. IV.2: Funciones de correspondencia- 2

    Por lo que respecta a posibilidad de lexicalización de las categorías, mi interpretación se basa en la concepción de la categorización como un mecanismo dinámico, un aspecto que no se toma en consideración, al menos de modo explícito, en la GC.

    Tomemos las expresiones 'gato callejero' y 'gato siamés'. Algunos de los gatos que por el mundo merodean pueden ser referidos mediante las anteriores expresiones. Ello implica una conceptualización diferenciada, basada en rasgos perceptivos (color, aspecto) o de otra índole, de un subconjunto de los gatos en relación al conjunto total; es decir, una categorización. O, si se prefiere, subcategorización; pero toda subcategorización es, en definitiva, una nueva categorización.

    Diversos factores parecen intervenir en la lexicalización o no lexicalización de una categoría: prominencia perceptual, convención social, convencionalización lingüística, o relevancia semiótica. La mayor confluencia de factores de este tipo posiblemente se hallen en relación directa con la posibilidad de lexicalización de la categoría. Ello explicaría por qué 'gato siamés' prácticamente se ha lexicalizado a partir del adjetivo: hablar de 'un siamés' es entendido sin problemas como hablar de un gato de este tipo; cosa que no ocurre con 'un callejero', expresión que difícilmente, a menos que exista un contexto muy marcado, podría reputarse como relativa a un gato.

    Este fenómeno podría explicarse, a mi juicio, a partir de las nociones de categoría estable y categoría ocasional. Cualquier agrupación de entidades del mundo en una única categoría mental, o concepto, es una categorización; por ejemplo, de entre todos los animales, [gato] , y de entre todos los gatos [siameses] y [gatos callejeros] . Algunas de estas categorías, por diversas razones, son utilizadas en la comunicación, dentro de una comunidad lingüística o social, de forma más recurrente que otras; en otras palabras, son más estables. La mayor estabilidad de una categoría favorecería su lexicalización, quedando para el resto, de índole más ocasional, la referencia mediante modos compositivos (adjetivación, grupos partitivos, etc.). Ejemplos del primer caso serían 'siamés' y 'mendrugo'; ejemplos del segundo, 'gato callejero' y 'trozo de pan'. Este fenómeno puede ser observado de forma diacrónica, analizando cómo una mayor recurrencia de uso de una categoría en una comunidad y un tiempo suele implicar la lexicalización del concepto ('teléfono móvil' -> 'móvil'; 'horno de microondas' -> 'microondas'); e incluso el fenómeno inverso de deslexicalización por pérdida de recurrencia de uso ('ultramarinos' -> 'tienda de comestibles') o confluencia de otros factores sobrevenidos con el paso del tiempo ('la dictadura' -> 'la dictadura de Primo de Rivera').

    De modo más específico, por lo que aquí nos atañe, la expresión mediante grupos partitivos de ciertas partes o porciones de cosas, estaría motivada por una menor estabilidad perceptual (indefinición de forma o de límites topológicos: 'un pedazo de pollo' frente a 'una pechuga') o funcional (carencia de una función distintiva respecto a la del todo: 'norte de España' frente a 'provincia').

    De modo relacionado, desde el punto de vista de los mecanismos fundamentales de construcción de las categorías mentales según las hipótesis de Rosch (1973), los esquemas parte-todo podrían estar relacionados con la lexicalización del siguiente modo. Se postula que la creación de una categoría (distinta de otra a la cual es similar en otros aspectos) es debida en muchos casos a diferencias estructurales analizables en términos de rasgos de parte (ver §2.2.1, esp. la fig. II.8). Por ejemplo, las aves se diferencian (entre otras cosas) del resto de los animales por tener alas. A mi juicio, la participación de un rasgo de parte en la construcción de una categoría -y por ende, en su diferenciación de otras categorías- es uno de los posibles factores determinantes de la lexicalización. En el ejemplo, la decisiva contribución de [ala] a la creación de la categoría [ave] sería motivo suficiente para la lexicalización del concepto, 'ala' -como sucede en español y en muchas otras lenguas-.

    A continuación trataré de la individuación y la lexicalización, de modo más estrictamente relacionado con ciertos aspectos relevantes del conocimiento parte-todo y con las necesidades de representación del significado.
 

4.1.2 Individuación y cuestiones relacionadas

    Una necesidad semiótica que probablemente cualquier lenguaje existente o concebible debe ser capaz de expresar es la de referirse a entidades como unidades discretas e individuales. Como acabamos de comentar, el mecanismo mediante el cual las lenguas extraen unidades individuales de un continuum de referencia suele ser denominado individuación (cf. Lyons, 1977).

    Las lenguas individúan mediante diversos tipos de recursos. Por ejemplo, en castellano, puede utilizarse la referencia deíctica ('ésto'), otros pronombres ('nosotros'), o un amplio espectro de sintagmas nominales ('dos árboles', 'una rama', 'café', 'una taza de café', 'este equipo', 'un grupo de gente', 'una cabeza de ganado', etc.). Como veremos en §5, lenguas de otros tipos, como las lenguas con clasificadores (vietnamita, japonés, thai, etc.) individuan en muchos casos utilizando construcciones con clasificadores, como las de (28), en dónde el nombre o su especificador combinan con una unidad léxica -en ciertas lenguas, por afijación, con un morfema- los cuales, por una parte aportan la noción de entidad individual y, por otra, establecen diversos tipos de especificaciones formales relativas a la entidad denotada por el grupo nominal (es decir, la clasifican de acuerdo con ellas). Ejemplos de tales especificaciones son: tipo de entidad, forma, colección, animacidad, consistencia, tamaño, disposición, cantidad, magnitud, etc -cf. Allan (1977); vid. §5.1, esp. la tabla V.1-. Asimismo, los clasificadores pueden ser usados, en ausencia del nombre, de modo anafórico o deíctico; como por ejemplo en (28c,d).

    (28)
    a. khru· lâ· j khon [profesor tres persona] = 'tres profesores'
    b. os-tehk te [árbol-planta tres] = 'tres árboles
    c. tua nán [cuerpo esto] = 'esto (animal, objeto)'
    d. sì· tua [cuatro cuerpo] = 'cuatro (animales, objetos)'

    Bunt (1981) -cf. Vossen (1994)- ha postulado que existen dos modos básicos de referirse a las entidades: discreto y cumulativo, los cuales corresponden en general a las nociones de conceptos delimitados y no delimitados -Jackendoff (1991), ver §2.2.2; Langacker (1991)-. El principal efecto relativo a la representación formal de ambos modos de referencia es que, mientras en el primer caso la acumulación es representable mediante conjuntos de entidades, en el segundo caso, lo es como una masa indiferenciada, de modo que una subdivisión de la entidad es concebida como una cantidad más pequeña de la misma cosa.

    El español, el inglés, y otras muchas lenguas, no disponen de marcas léxicas superficiales que distingan entre ambos tipos de conceptos; por consiguiente las diferencias deben ser deducidas a partir de su comportamiento gramatical (contabilidad/no contabilidad de la unidad léxica). Por ejemplo, en español, la posibilidad o imposibilidad de combinación con numerales y otros determinantes; en inglés, además, alternancias entre 'much' y 'many' y similares. Por el contrario, en las lenguas con clasificadores, los nombres son por defecto no delimitados (en el sentido de Jackendoff, 1991); es decir, en ausencia de ulteriores especificaciones realizadas mediante clasificadores, implican una referencia cumulativa (en el sentido de Bunt, 1981).

    En resumen, parecen existir en relación a esta cuestión dos principios básicos probablemente independientes de lenguas en particular:

    (1).- Existen dos modos fundamentales de conceptualizar las cosas y de referirse a ellas mediante el lenguaje: como entidades individuales o como masa;

    (2).- La comunicación requiere que los lenguajes tengan modos de expresar la individuación.

    La existencia de sistemas lingüísticos como las lenguas con clasificadores indica que los hablantes de lenguas como el castellano o el inglés no deben prejuzgar que, tal como parecen indicar sus sistemas lingüísticos, la discretividad sea una especie de noción por defecto o un hecho que pueda establecerse de forma objetiva por dimanar directamente de como son las cosas en realidad. De hecho, como puede verse, en otras lenguas la noción por defecto perece ser la contraria.

    Sirva esta argumentación de base para notar que, en español, una misma entidad puede ser referida alternativamente bien mediante conceptos delimitados, bien mediante conceptos no delimitados -o en la terminología de Bunt, de modo discreto o de modo cumulativo-. En función del punto de vista del hablante, o dependiendo de factores pragmáticos, una puede ser llamada 'ruido' (29a,b); un cigarrillo, 'tabaco' (29c,d); un palo, 'madera' (29e,f); una pelea, 'violencia' (29g,h); o un rebaño, 'animales' (29i,j), o incluso 'carne'(29k).

    (29)
    a. ¡Qué canción tan hermosa!
    b. ¡Vaya ruido espantoso!
    c. ¿Tienes un cigarrillo?
    d. ¿Tienes tabaco?
    e. Trae aquí ese palo
    f. Trae aquí esa madera
    g. Dicen que hubo otra pelea en Salt Lake City
    h. Volvió la violencia a Salt Lake City
    i. Esos rebaños son del Rey
    j. Esos animales son del Rey
    k. Toda esa carne es del Rey

    En los casos de (29), una determinada entidad es expresada mediante palabras distintas y pertenecientes a clases distintas -desde el punto de vista del modo fundamental de conceptualización (discreto o cumulativo, delimitado o no delimitado)-. A continuación veremos en (30) como tambien se da un fenómeno en cierta forma contrapuesto: un único lexema es usado para expresar conceptualizaciones distintas (delimitada versus no delimitada) de una entidad.

    (30)
    a. Trae más café
    b. Trae otro café
    c. Voy a comer arroz
    d. Voy a comerme un arroz
    e. Están recogiendo la aceituna
    f. Están recogiendo aceitunas
    g. Hay mucho coche hecho polvo por ahí
    h. Hay muchos coches hechos polvo por ahí

    Los pares (30a,b) y (30c,d) son ejemplos del caso más típico de esta clase de fenómeno: las alternancias masa/contable, en donde una palabra que denota una entidad en principio de tipo masivo (o si se prefiere, cumulativo, o no delimitado), como [café] o [arroz], es usada para expresar una conceptualización de orden discreto o individualizado, en los casos de los ejemplos dosis convencionalizadas de la sustancia en cuestión -presumiblemente [una taza] de café en (30b) y [un plato] de arroz en (30d)-.

    Un caso similar pero distinto de alternancia delimitado/no delimitado, es el de pluralización no marcada superficialmente, representado por los pares (30e,f) y (30g,h). El modo habitual de referirse a una multiplicidad indefinida de unidades individuales es mediante el uso del plural (30f,h: 'aceitunas', 'coches'); sin embargo, también es posible en el contexto adecuado usar la forma en singular, como en (30e,g). Con ello resulta que, una misma forma léxica, el singular 'aceituna' o 'coche', puede ser usado tanto del modo habitual para denotar un único elemento de un tipo (una única aceituna, un único coche), como para referirse a una pluralidad de elementos de dicho tipo (una multiplicidad de aceitunas o de coches). En casos como este último, la pluralidad es vista del mismo modo que, por ejemplo, en 'arroz', en dónde las unidades individuales (granos de arroz, aceitunas individuales), aunque existentes, parecen caer fuera del alcance conceptual, siendo únicamente relevante la masa genérica.

    Los fenómenos de (30a,b,c,d), individuación de nombres de masa o delimitación de conceptos no delimitados parecen radicar en el mismo principio fundamental que permite un fenómeno inverso, el denominado grinding (ver en §2.2.2 la presentación del análisis de Jackendoff, 1991) o masificación de entidades individuales, que se ilustraba mediante los ejemplos de (10), un par de los cuales reproduzco a continuación en (31a,b), junto a otro ejemplo similar (31c,d).

    (31)
    a. The car ran over a dog ('El coche atropelló a un perro')
    b. There was dog all over the street ('Había perro por toda la calle')
    c. Ponle un tomate a la ensalada
    d. Ponle tomate a la pizza

    Las palabras 'perro' en (31a) y 'tomate' en (31c) deben recibir la interpretación de entidad individual; sin embargo, las mismas en (31b) y (31d) deben ser interpretadas como una sustancia derivada del correspondiente individual -en el caso, bastante repugnante por cierto, de (31b), la sustancia de la que están hechos los perros; en el de (31d), presumiblemente salsa confeccionada a partir de la sustancia de la que están hechos los tomates-.

    Las regularidades fundamentales que se extraen de los ejemplos de (29), (30) y (31) son, a mi juicio, las siguientes:

    • Dado un objeto semántico de un cierto nivel ontológico: una entidad (nivel de los referentes, o mundo) o un lexema (nivel del lenguaje) siempre es posible, en las condiciones pragmáticas apropiadas, algún tipo de alternancia discreto/cumulativo, o delimitado/no delimitado.
 

Por una parte, una entidad -como p.e. una canción (29), una cierta cantidad de café (30), o una pluralidad de aceitunas (30)- puede ser referida tanto mediante unidades delimitadas como no delimitadas. Por otra parte, una misma forma léxica -como 'café'(30a,b), 'arroz' (30c,d), 'perro' (31a,b) o 'tomate (31c,d)- puede referir tanto a entidades individuales como a una masa.

    • Ese tipo de alternancias parecen estar basadas en el siguiente principio general de conceptualización: las entidades (sean físicas o abstractas) están hechas de algún tipo de sustancia o materia.
 

 Por ejemplo, [un café] está hecho de [café] ; [un perro] está hecho de [perro/carne]; [una canción] está hecha de [sonido/ruido]; [una botella] está hecha de [cristal] ; [una información] está hecha de [información] ; [una hoja de papel] está hecha de [papel] .

    Las anteriores consideraciones, sin embargo, no deben en absoluto llevar a pensar que cualquiera de las interpretaciones alternativas de una palabra goza de un mismo status lingüístico. En otras palabras, algunos lexemas (p.e. 'tomate', 'perro', 'canción') típica y habitualmente son utilizadas en el lenguaje para denotar entidades individuales; por lo que las interpretaciones de tipo masa deben ser consideradas como secundarias o derivadas. En otros casos (p.e. 'café', 'arroz', 'ruido') el proceso es el inverso. Es decir, a pesar del hecho de que, dado un contexto lingüístico o pragmático apropiado, los nombres pueden ser forzados a adoptar denotaciones alternativas -en cuanto a la oposición discreto/cumulativo-, la intuición de los hablantes parece indicar que una de ellas es la básica, y la inversa la derivada.

    Asimismo, es preciso hacer notar que este fenómeno no depende, como mínimo totalmente, de cómo son las cosas en realidad, sino de cómo son conceptualizadas. Veámoslo con un par de ejemplos. Adviértase en primer lugar que no parece existir diferencia perceptual objetiva entre el arroz y las lentejas que justifique el por qué el primero es denotado mediante un nombre de masa, y las segundas mediante un nombre contable. En segundo lugar, obsérvese cómo un mismo concepto es tratado de forma discreta en una lengua, y de forma cumulativa en otra. Por ejemplo, recuérdese el ejemplo mostrado anteriormente en (24). En inglés una multiplicidad de muebles es referida mediante el colectivo en singular 'furniture', y un mueble individual mediante el partitivo 'piece of furniture'; en español sucede de modo inverso: la entidad individual es expresada mediante el nombre contable en singular 'mueble', y una multiplicidad mediante su plural, 'muebles'.
 

4.1.3 Lexicalización y grupos partitivos

    Diversos tipos de entidades, aparte de entidades individuales típicas (32a,b) pueden ser referidas de modo discreto. Por ejemplo: un conjunto o pluralidad (32c,d,e); una cantidad de sustancia (32f,g,h); o una parte, porción o elemento de una entidad discreta (32i,j,k,l):

    (32)
    a. un árbol
    b. un palo
    c. una jauría de lobos
    d. un equipo
    e. ganado, animales
    f. un vaso de vino, un vino
    g. una madera, un trozo de madera
    h. un arroz, un plato de arroz
    i. una rama
    j. la cima de una montaña
    k. una cabeza de ganado
    l. uno del equipo

    Además, resulta evidente que, como se ha apuntado anteriormente, no toda entidad individual es lexicalizada en una determinada lengua o comunidad. Algunas, como 'árbol', 'palo' y 'equipo' en español, lexicalizan (32a,b,d); otras no lexicalizan, y son referidas mediante sintagmas partitivos, como 'jauría de lobos' o ' la cima de una montaña' (32c,j). Finalmente otras pueden ser expresadas de ambos modos, dependiendo de la perspectiva del hablante: 'un vino' <--> 'un vaso de vino'; 'una madera' <--> 'un trozo de madera'; 'un arroz' <--> 'un plato de arroz' (32f,g,h).

    Una consecuencia para la representación semántica de los nominales es que, como se ha dicho, en muchos casos, nombres y sintagmas partitivos son denotacionalmente equivalentes. Por consiguiente, las representaciones semánticas de ciertos tipos de nombres y las de los sintagmas partitivos deben ser de algún modo equivalentes. Por ejemplo (con algunos matices), la composición semántica de 'cabeza' + 'de' + 'ganado' debe dar lugar a una representación a la de 'animal'; o la de 'vara' + 'de' + 'madera' a la de 'palo'.

    De modo más específico, es preciso que, en el procesamiento del lenguaje, las representaciones formales de las construcciones partitivas puedan ser tratadas de un modo análogo a las de los nombres referenciales. Considérense los ejemplos de (33):

    (33)
    a. Eduvigis tiene que corregir un examen
    b. Eduvigis tiene que corregir una montaña de exámenes
    c. Estoy terminando el libro
    d. Estoy terminando el segundo capítulo del libro
    e. Se ha constituido el Senado
    f. ?? Se han constituido los miembros del Senado
    g. * Se ha constituido un miembro del Senado

    En (33a), las restricciones selectivas de 'corregir' (en el sentido apropiado) se ven satisfechas por el complemento, 'un examen'; e igualmente en (33b) por 'una montaña de exámenes'. Ello implica que tanto el nombre 'examen' como el grupo partitivo 'montaña de exámenes' deben recibir el mismo tipo semántico. En consecuencia la composición de 'montaña' + 'de' + 'exámenes' debe dar lugar a una estructura de tipo 'examen', y no, por ejemplo, de tipo 'montaña'.

    'Terminar' y verbos similares (cf. Pustejovsky, 1995) seleccionan argumentos de tipo eventivo. Por ejemplo, las oraciones de (33c,d) reciben una interpretación en la que se hallan implícitas las nociones 'leer' o 'escribir'. Tanto 'estoy terminando el libro' como 'estoy terminando el segundo capítulo del libro' son interpretables, bien como 'estoy terminando de escribir el libro/el segundo capítulo del libro', bien como 'estoy terminando de leer el libro/el segundo capítulo del libro'. Por consiguiente, dado que tanto (33c) como (33d) son oraciones posibles y aceptables, la representación semántica del grupo partitivo 'capítulo del libro' debe contener algún tipo de especificación, también presente en el nombre 'libro', relativa a que tanto una como otra entidad implican eventos de tipo 'leer' o 'escribir'.

    Finalmente, la dudosa aceptabilidad de (33f) frente a la aceptabilidad de (33e) es achacable al hecho de que 'Senado' es un grupo o colectivo que se crea al ser 'constituido'; siendo discutible que pueda hablarse de la 'constitución' de elementos individuales de dicho colectivo. En todo caso, sí resulta totalmente inaceptable la frase (33d), '*se ha constituido un miembro del Senado'. Pustejovsky (1995) describe fenómenos similares del inglés como casos de co-composición (vid. §6.1), es decir, casos en que la composición del grupo verbal es posible a partir de la coincidencia de ciertos elementos semánticos presentes tanto en el verbo como en el complemento. En el caso del ejemplo, la estructura del verbo 'constituir' (en su sentido apropiado) contendría la noción de creación de una entidad a partir de la amalgama de sus partes. De igual modo, 'Senado' deber contener una información análoga: como grupo o colectivo se crea por agrupación de elementos. En cambio, 'miembro del Senado', al no ser un grupo sino una entidad individual simple, no puede ser concebida como creada por agrupación, por lo que no puede combinar con un verbo como 'constituir'.

    En resumen, es necesario en un formalismo de representación del significado dar cuenta de este tipo de problemas; especialmente de la relación existente entre las especificaciones semánticas de los nombres referenciales y las de los grupos partitivos formados a a partir de éstos. En concreto, se debe dar cuenta de:

    (a)- cómo el significado de los primeros (p.e. 'examen') contribuye al de los segundos (p.e. 'montaña de exámenes');

    (b)- qué aspectos semánticos se conservan y cuáles no;

    (c)- cuál es la contribución de la semántica del nombre partitivo ('montaña', 'capítulo') al grupo completo ('montaña de exámenes', 'capítulo del libro');

    y (d)- qué tipo de especificaciones que no se hallaban presentes en el complemento son aportadas por el partitivo (p.e., 'montaña': información de magnitud; 'capítulo': información de ser parte).

    En definitiva, los formalismos de representación deben suministrar los mecanismos necesarios para combinar partitivos y nombres a fin de obtener las representaciones adecuadas para los sintagmas resultantes.

4.2 Propuesta de definición de los tipos
de relación parte-todo


4.2.1 Esquemas merológicos generales
4.2.2 Extracción de relaciones meronímicas


    ¿Qué tipos de relación merológica es conveniente definir en un lexicón? La situación óptima sería incluir las que existan en el lexicón mental. Pero, por supuesto, no pueden hacerse afirmaciones taxativas sobre la estructura del pensamiento lingüístico. Por otra parte, los modelos mentales existentes (ver §2) formulan tesis notablemente diversas, especialmente desde el punto de vista cuantitativo, desde las tres decenas de relaciones postuladas por Chaffin y Hermann (1988) hasta los tres esquemas de Iris et al. (1988). Sin embargo, desde el punto de vista cuantitativo, todas las aproximaciones que hemos visto facilitan información en muchos aspectos similar, o asimilable, y toda ella de gran valor e interés.

    Una aproximación razonable a la construcción de un lexicón formalizado sería el intentar codificar los diversos tipos de información merológica postulados utilizando un número reducido de recursos. Ésta es mi intención, organizar el conocimiento merológico en el lexicón de un modo estructuralmente simple e informativamente optimizado.

    Vistos los modelos presentados en §2, creo que es posible representar la multiplicidad de relaciones que se postulan únicamente mediante tres esquemas merológicos fundamentales: parte-entidad, elemento-multiplicidad, y materia-entidad.

    Obsérvese que muchas de las relaciones parte-todo que se han postulado parecen responder a un mismo esquema subyacente realizado entre tipos distintos de entidad.

    En un modelo de lexicón estructurado taxonómicamente, dicho planteamiento resulta redundante, pues la información relativa al tipo de entidad es inferible de la jerarquía; por lo que no es necesario codificarla nuevamente en la relación parte-todo.

    Por ejemplo, la postulación de dos relaciones distintas en los casos de (34), realizada por Chaffin y Herrmann (1988) (ver tabla II.3) resulta innecesaria por redundante ya que ambas son tipificables como una única relación denominable, por ejemplo, componente funcional - objeto, que suceda, respectivamente, en cosas vivas y en artefactos.

    (34)
    a. Cosa Viva- Componente ('tulipán'-'pétalo')
    b. Artefacto Complejo- Componente ('cámara'-'lente')

    Sin duda existen matices diferenciales entre las posibles relaciones parte-cosa viva y parte-artefacto. Por ejemplo, el artefacto se crea a partir del ensamblado de las partes, mientras que en las cosas vivas las partes nacen con la cosa. Sin embargo, en mi opinión, también ello es atribuible a la propia naturaleza de ambas, es decir, al tipo de entidad al que pertenecen: por definición, los artefactos son compuestos (por el hombre) y las cosas vivas nacen y se desarrollan de forma autónoma y unitaria sin que sean compuestas a partir de partes preexistentes.


Fig. IV.3: Comparación de Modelos de Representación

    La diferencia entre ambas aproximaciones puede ser vista como en la fig. IV.3, que muestra en la parte superior una representación del tipo propuesto por Chaffin y Herrman, y en la inferior una representación en una estructura de rasgos tipificada en la que el tipo pertenece a una jerarquía.
 


Fig. IV.4: miembros de colectivos y de grupos
en un lexicón organizado taxonómicamente

    Desde este punto de vista, otro ejemplo de redundancia en el modelo de Chaffin y Herrmann es la postulación de relaciones diferenciadas colectivo-miembro y grupo-miembro. Véase en Fig. IV.4 cómo la estructuración jerárquica del lexicón ya desambigua entre ambas, por lo que son subsumibles en una única relación denominable, p.e. 'elemento de'.

    Ejemplos como éste y los de (34) parecen indicar que lo que realmente resulta interesante desde el punto de vista de la representación de las relaciones parte-todo es el tipo general de la relación, es decir, la información del modo de inclusión entre entidades que no es inferible a partir del resto de la información ya presente en la representación semántica.

    A continuación presentaré los esquemas merológicos generales que postulo, para pasar a continuación a analizar las aproximaciones de §2 basándome en dicha propuesta.
 

4.2.1 Esquemas merológicos generales

    A mi juicio, los diversos tipos de información parte-todo son expresables mediante los tres esquemas generales siguientes:

    Componente - Entidad. Una entidad es analizable en partes de tipos distintos.
    Elemento - Multiplicidad. Una entidad está compuesta de múltiples elementos de un mismo tipo.
    Materia - Entidad. Relación entre una entidad y la materia de que está hecha.

    En general, la relación de componente presupone algún tipo de funcionalidad diferenciada de la parte. Ya hablaremos de ello con más detalle, pero en principio parto de la hipótesis de que el hecho de que los hablantes distingan partes de un todo no es un hecho arbitrario o inmotivado, sino que por el contrario se fundamenta necesariamente en una motivación semiótica. La conceptualización diferenciada de una entidad respecto a otra en la que está incluida responde en último término a la necesidad de expresar algún tipo de comportamiento diferenciado de la parte en algún aspecto.

    Sin embargo, tal característica no puede considerarse distintiva respecto a la relación de elemento: necesariamente un elemento tiene una función diferenciable de la del conjunto en que se incluye -aunque tan sólo sea la de constituir el conjunto a partir de la acumulación de elementos-.

    Por su parte, el esquema materia-entidad implica una indiferenciación o no distinguibilidad de la materia respecto a la entidad que de ella está formada. En muchos casos este esquema responde simplemente a una diferencia en la conceptualización de una misma cosa -ver ejemplos (29) y (30) en la sección anterior-.

    A diferencia de lo que ocurre con los esquemas de componente y de elemento, en el caso materia-entidad no resulta evidente la designación de uno de los polos de la altenancia como 'todo' y del otro como 'parte'. Los esquemas componente-entidad y elemento-multiplicidad son analizables en términos de algún tipo de inclusión, sea ésta espacial (pétalo-flor), temporal (acto-obra de teatro), o simplemente conceptual (fe-religiosidad). En cambio, en una relación del tipo [silla] -[madera] no existe una clara inclusión de una cosa en otra en el espacio o en el tiempo. Puede considerarse que el objeto contiene la materia de la que está formado. Pero también puede verse el objeto como una realización puntual de la materia considerada como un todo global -la silla vista como una parte de la madera que hay en el mundo-.

    La convención que adoptaré aquí será la primera, considerar la materia como incluída en la entidad, por lo tanto en una relación [silla] -[madera] diré que silla es el todo y madera la parte. Quede claro sin embargo, que se trata únicamente de una convención.

    En relación a la inclusión de entidades, debe hacerse otro tipo de puntualización, más importante desde el punto de vista epistemológico. Como he sugerido, múltiples relaciones parte-todo son analizables como inclusiones de entidades en el espacio o en el tiempo; otras sólo como inclusiones conceptuales. Pero ello no debe llevar a postular que las inclusiones espaciales o temporales no son a su vez inclusiones conceptuales. Por el contrario, como he dicho (ver §4.1, y anteriormente §1) entendemos como objeto de la representación no las posibles 'entidades del mundo real' sino su conceptualización, o abstracción en un modelo -que desde un punto de vista mentalista sería un modelo de la mente; o desde un punto de vista más estrictamente lingüístico, un modelo del conocimiento semántico-. En consecuencia, aunque hablaré en lo sucesivo de inclusiones de tipo espacial o temporal, debe entenderse que tal terminología refiere un último término a inclusiones en el marco de la conceptualización del espacio o del tiempo -no a inclusiones decidibles objetivamente con independencia de la existencia de los hablantes o de un modelo de representación semántica-.

    Hechas las anteriores puntualizaciones regresemos a la especificación de los esquemas merológicos básicos.

    Dichos esquemas son interpretables de forma simple a partir de las nociones de delimitación y granularidad de Jackendoff (1991) -ver §2.2.2- del modo siguiente.
 

    Esquema parte-todo     Todo     Parte
    entidad-componente     - G     + D
    multiplicidad-elemento     + G     + D
    entidad-materia       - D

Tabla IV.1: Esquemas merológicos básicos analizados
según rasgos conceptuales de Jackendoff (1991)


Fig. IV.5: Representación simbólica de los esquemas merológicos básicos

    Los esquemas componente-entidad y elemento-multiplicidad se distinguen entre sí porque en el segundo caso el todo es granular (+G) y en el primero no (-G). Es decir, una multiplicidad se compone de múltiples partes de un mismo tipo (p.e. rebaño-animales domésticos). En cambio las diferentes partes componentes de una entidad son distintas entre sí (p.e. cuerpo- cabeza, brazos, piernas, ...).

    A su vez, el esquema materia-entidad se distingue de los anteriores en que en aquéllos las partes son entidades delimitadas (+D), mientras que en éste la parte es una masa, materia, o sustancia (por tanto, no delimitada: -D). Desde este punto de vista los tres esquemas son representables como en la tabla IV.1, y de un modo más gráfico e intuitivo pueden ser vistos como en la Fig. IV.5.

    A efectos de representación, cada esquema se codificará mediante uno de dos rasgos inversos, dependiendo del sentido de la relación. Elijo para los atributos que son realizaciones del esquema componente-entidad los nombres 'parte_de' y 'tiene_parte' (según la dirección de la relación) simplemente debido a su mayor generalización de uso; p.e. en WordNet se utilizan dichas etiquetas para designar ese tipo de relaciones indicativas de 'componente' o 'parte funcional'. Esta convención implica asumir para 'parte' un sentido aproximado de [parte funcional]. El esquema elemento-multiplicidad se representará mediante los descriptores 'elemento_de' y 'tiene_elemento' y el esquema materia-entidad mediante 'materia_de' y 'tiene_materia' (ver tabla IV.2).


Tabla IV.2: Terminología que se utilizará en las estructuras de rasgos

    Así, por ejemplo:

   (35)
    a. [tulipán
    tiene_parte: pétalo]

    b. [pétalo
    parte_de: tulipán]

    c. [rebaño
    tiene_elemento: oveja]

    d. [oveja
    elemento_de: rebaño]

    e. [vaso
    tiene_materia: cristal]

    f. [cristal
    materia_de: vaso]

    Evidentemente, la representación de una entidad no debe limitarse necesariamente a uno solo de dichos tipos, pues puede hallarse relacionada a otras entidades por esquemas merológicos distintos. Por ejemplo, una oveja, simultáneamente, tiene cabeza, patas, etc.; está hecha de carne; y puede ser parte de un rebaño:

    (36)
    [oveja
    [tiene_parte: cabeza, patas, ...
    tiene_materia: carne, ...
    elemento_de: rebaño]]

    A continuación analizaré los diversos tipos de relación parte-todo que se han postulado a partir de los anteriores esquemas básicos.
 

    Comparación con modelos simples: Iris et al. y WordNet

    La aproximación elegida es similar en cuanto a planteamientos a la de Iris et al. (1988), y en cuanto a tipo y número de relaciones a la utilizada de facto por WordNet (Miller et al., 1990).

    En el primer caso ello es debido a que se opta por un número reducido de esquemas conceptuales que subsumen las múltiples relaciones postuladas por Chaffin y sus colegas. Recordemos que Iris et al. postulan (vid §2.2.1) las relaciones ComponenteFuncional-Todo, Miembro-Colección, Segmento-Todo, e Inclusión de Conjuntos (taxonomía).

    Las dos primeras corresponden a Componente-Entidad y Elemento-Multiplicidad de mi propuesta. La Inclusión de Conjuntos, o relación taxonómica, no la trato en este trabajo como una de las relaciones merológicas. La organización jerárquica de un lexicón basándose en la relación de hiponimia es considerada, como suele ser habitual (p.e. vid modelos de Cruse, 1986) un tipo de relación diferente a las relaciones de parte.

    Argumenta Cruse que, mientras la taxonomía es una jerarquía de clases la meronimia una clase de jerarquías. Dicho razonamiento puede ser precisado en términos de inclusión de la siguiente forma: en una taxonomía o relación de hiponimia, dado que las palabras relacionadas de tal modo denotan categorías o clases de entidades -interpretables al modo logicista como conjuntos- ocurre que la clase denotada por el hipónimo está incluída como tal clase en aquella denotada por el hiperónimo. Sin embargo, en una relación merológica, lo que sucede es que cada instancia de la clase denotada por la palabra de la 'parte' está incluida en una instancia de la clase denotada por la palabra del 'todo'. Es decir, mientras la taxonomía sería, en términos de conjuntos, una relación de inclusión entre conjuntos, la meronimia sería una función entre conjuntos motivada por la relación de inclusión existentes entre sus elementos.

    Por ejemplo, la existencia de una relación taxonómica entre 'coche' y 'vehículo', implica que el conjunto de los coches está incluído en el conjunto de los vehículos; mientras que la existencia de relación meronímica entre 'cigüeñal' y 'coche' implica que dado un elemento perteneciente al conjunto de los cigüeñales y otro elemento del conjunto de los coches, el primer elemento está incluído en el segundo.

    Finalmente, Iris et al. postulan la existencia de un esquema Segmento-Todo -y ofrece los ejemplos 'rebanada de pan', 'grano de arroz' y 'taza de arroz'-. Desde mi punto de vista cabe destacar dos aspectos en este tipo de esquema.

    En primer lugar, aunque Iris et al. no lo manifiestan abiertamente, puede inferirse a partir de los ejemplos que Segmento-Todo no es un esquema que suela instanciarse entre conceptos lexicalizados. No es postulable una relación meronímica entre 'rebanada' y 'pan' o 'grano' y 'arroz' -como se hace sistemáticamente en los trabajos de la escuela de Winston, Chaffin y Herrmann-, ni mucho menos entre 'taza' y 'arroz'. En todo caso las correspondientes relaciones de inclusión serían entre 'pan' y 'rebanada de pan'; 'arroz' y 'grano de arroz'; y 'arroz' y 'taza de arroz'.

    Los lexemas 'rebanada', 'grano' y 'taza', en sí, no presuponen implicación alguna respecto al tipo de entidad con la que puedan estar relacionadas mediante un esquema merológico. Dichos lexemas son nombres partitivos, desde el punto de vista lógico, predicados relacionales, es decir, unidades léxicas que no son plenamente referenciales sino únicamente al establecer relación con una unidad léxica que sí lo es. Por utilizar uno de los ejemplos propuestos de forma recurrente, digamos que el concepto [rebanada] no implica parte división o segmento de pan, sino, de modo general, de cualquier entidad susceptible de ser cortada en rebanadas.

    En algunos casos, los menos, sí que es postulable una relación Segmento-Todo entre conceptos lexicalizados, por ejemplo entre 'mendrugo' y 'pan'. No existe para mí mayor diferencia entre esta relación y la que se establece entre 'pan' y 'trozo de pan' -aparte del hecho de la lexicalización y del matiz semántico de que 'mendrugo' suele denotar trozo de pan viejo o desechado-, por lo que analizaré ambos casos a partir del mismo esquema fundamental. Un argumento más en ese sentido lo tenemos en que mi trabajo se basa en la premisa de que el mismo sistema debe ser utilizable para analizar relaciones de parte entre entidades, independientemente de que éstas se hallen o no lexicalizadas en el lenguaje.

    En general, como se ha sugerido y se discutirá ampliamente más adelante, cualquier tipo de construcción partitiva es analizable también mediante alguno de los tres esquemas merológicos generales. En particular, los ejemplos de construcción partitiva definidos por Iris et al. como relaciones Segmento-Todo son analizables mediante el esquema entidad-materia.

    Consideremos 'rebanada de pan'. El grupo partitivo denota una entidad delimitada e individual (perceptible separadamente). Tiene ciertas características formales: grosor reducido en relación a su anchura y longitud (por tanto, idealizando, aspecto bidimensional). Además tiene una característica determinante de tipo agentivo: ha sido obtenida por corte transversal de un pan ('rebanar'). Finalmente, en cuanto a relación merológica, su característica fundamental es la siguiente: se trata de una entidad hecha de lo mismo que esta hecho el pan. En realidad no es otra cosa que pan, cortado en rebanadas. En pocas palabras, una [rebanada de pan] está hecha de [pan].

    Por consiguiente, este tipo de relación Segmento-Todo está basado en el esquema entidad-materia. El hecho de que la entidad individuada (el segmento en la terminología de Iris et al.) muestre ciertas propiedades diferenciadas respecto al todo (la materia) -forma, medio de obtención, etc.- no es nada distinto de lo que ocurre en cualquier otra relación parte-todo: las entidades relacionadas, la parte y el todo, tienen rasgos similares y rasgos disimilares, lo relevante para la merología es la relación de inclusión en la que se hallan. De igual forma, un [mendrugo] establece con [pan] una relación hecho de, aumentada con otras características de orden no merológico (p.e. el pan es viejo o desechable).

    En cuanto a WordNet 1.5 (ver §3.1), aunque en la documentación del sistema (p.e. Miller et al., op. cit.) se anuncia que la intención es incluir todos los tipos de relación propuestos por Winston, Chaffin y Herrmann (1987), en realidad únicamente se implementan tres tipos de relación parte-todo: part-of, member-of y substance-of, las cuales corresponden en líneas generales a los esquemas que propongo.

    La elección realizada de facto por WordNet parece ser debida a una necesidad de simplificación en cuanto al número de relaciones, causada por la gran cantidad de léxico que es preciso representar. Esta intención simplificadora coincide con mis planteamientos. En mi caso, sin embargo, no se trata de que me limite a representar únicamente las relaciones más simples, sino que la intención es representar mediante estructuras simples todo tipo de información merológica.
 

    Comparación con los modelos de Winston et al. (1987) y Chaffin y Herrmann (1988)

    El referido grupo de psicolingüistas ha desarrollado dos modelos generalizantes, Chaffin y Herrmann (1984) y Winston, Chaffin y Herrmann (1987) -ver tabla II.2 en §2.1.2-, similares entre sí. Como vimos en la sección correspondiente dichos modelos fueron detallados en Chaffin y Herrmann (1988), análisis que resulta en un mayor número de relaciones -ver tabla II.3 en §2.1.2-.

    Me referiré básicamente al modelo general de Winston et al. (1987) -en el resto de la sección: WCH1987- dado que, como se ha dicho, se ha convertido en referencia fundamental para la mayoría de estudios e implementaciones formales de la meronimia. A partir de los comentarios sobre WCH1987 haré referencia a su especialización, Chaffin y Herrmann (1988) -en el resto de la sección, CH1988-.

    La relación Componente-Objeto de WCH1987 está incluída en su totalidad en mi esquema componente-entidad. Simplemente uso el término 'entidad' en lugar del de 'objeto' por ser más general y a fin de abarcar no únicamente entidades físicas concretas, sino entidades de todo tipo; de hecho los autores proponen ejemplos de dicha relación que no son clasificables como 'objetos', a menos que se entienda 'objeto' en un sentido amplio como sinónimo de 'entidad'.

    Las especializaciones que hacen CH1988 de esta relación radican fundamentalmente en diferencias de tipo de entidad ('evento dramático', 'cosa viva', 'artefacto'), siendo por tanto redundantes en cuanto a información merológica, por lo que son subsumibles en un mismo esquema componente-entidad. Asimismo, también resulta redundante la distinción que establecen entre artefactos simples y complejos, dado que la diferencia es inferible en la representación a partir del número de relaciones tiene_parte de la entidad: un artefacto complejo tendrá diversos componentes y un artefacto simple solo uno o dos, o muy pocos -dependiendo también de dónde quiera trazarse el límite entre artefactos simples y complejos-.

    La segunda relación de WCH1987, Miembro-Colección, corresponde exactamente al esquema elemento-multiplicidad: una entidad concebida como amalgama o agrupación de múltiples elementos de un mismo tipo. La diferenciación de CH1988 entre Colección-Miembro ('ganado' - 'animal') y Grupo-Miembro ('rebaño' - 'animal') es directamente inferible del tipo de entidad inclusiva: colectivos (o, según la terminología que se adopte, agregados) frente a grupos, representable en la taxonomía. El sistema de tipos que propondré (ver §6) incorpora esta distinción básica, a partir de las distinciones definidas en el modelo de Jackendoff (1991) -ver §2.2- entre conceptos delimitados y no delimitados. En líneas generales, los grupos ('rebaño', 'equipo') son concebidos como entidades cerradas o delimitadas en el espacio, el tiempo o el número de componentes; mientras que los agregados ('gente', 'ganado') no sufren tales delimitaciónes.

    Respecto a la subclase de CH1988 Organización-Unidad ('ejército' - 'batallón') la información de que la entidad incluida es a su vez una multiplicidad es asimismo redundante por inferible, tanto a partir de la jerarquía de tipos ('batallón': grupo; frente a 'soldado': individuo), como de la propia existencia para la misma de relaciones merológicas tiene_elementos. En todo caso el esquema parte-todo fundamental sigue siendo el mismo: una entidad compuesta de múltiples entidades de un mismo tipo.

    Veamos a continuación la relación Material-Objeto de WCH1987 y las relaciones Masa-Material ('ensalada' - 'lechuga') y Objeto-Material ('bicicleta' - 'aluminio') de CH1988. Corresponden al esquema general materia-entidad o alternancia entre una entidad y aquéllo de lo cual se concibe que está hecha. Sin embargo CH1988 establecen un matiz importante: la distinción entre la pura alternancia Objeto-Material y la relación de ingrediente (Masa-Material, en su terminología). En el primer caso se concibe la totalidad del objeto o entidad como hecha de una determinada materia y una sola. En el segundo la entidad inclusiva se concibe como constituida a partir de materias de diversos tipos (p.e. 'ensalada': lechuga, tomate, etc.).

    Nuevamente, esta distinción es inferible en el lexicón a partir del número de relaciones tiene_materia que establece la entidad inclusiva (una sola, o varias), luego ambos subtipos de relación pueden ser mantenidos dentro de un mismo esquema materia-entidad.

    La relación y subrelaciones de Porción-Masa de WCH1987 y CH1988 corresponden al esquema Segmento-Todo de Iris et al. (1988), por lo que me remito a lo comentado anteriormente respecto al mismo: básicamente, los nombres partitivos como 'grano' o 'trozo' no son partes sino constructores de relaciones de parte.

    Mi análisis de las relaciones Lugar-Área de WCH1987 y Área-Lugar o Tiempo de CH1988 -con sus subtipos ÁreaNatural-Lugar ('desierto'-'oasis'), ÁreaDenominada-Lugar ('Florida'-'Everglades') y TiempoDenominado-Ocasión ('Pascua'-'Viernes Santo')- es el siguiente: nuevamente, dichas relaciones son instancias del esquema general componente-entidad, con la especificidad de que remite a entidades de tipo locativo o temporal. En consecuencia no es preciso proponer un tipo diferenciado de representación para ellas.

    Winston et al. aducen para justificar la especificidad de la relación la no funcionalidad y la no separabilidad de las partes respecto al todo. En mi opinión el primer argumento no es válido y el segundo no es suficiente. En el primer caso, sin duda debería definirse de modo preciso qué debe entenderse por funcionalidad para emitir un juicio riguroso. Pero utilizando únicamente una aproximación intuitiva creo que no es descabellado pensar que, desde el punto de vista de la comunidad de humanos que tenga relación con la entidad en cuestión (y sin duda la noción de funcionalidad debe establecerse en relación a dicha comunidad), por ejemplo un oasis tiene una clara función distintiva respecto al desierto en el que se enmarca. Del mismo modo, en una comunidad católica el Viernes Santo tiene una especificidad muy marcada respecto a la Semana Santa en general.

    En cuanto a separabilidad de la parte, sin duda, en el mundo real, un lugar no es físicamente separable de un lugar en el que está incluido -y mucho menos un tiempo, pues el tiempo, por definición, es un continuo y no es físico, en el sentido de material-. Pero esta característica no es distintiva respecto a otras relaciones de parte. Un objeto tampoco es separable de la materia de que está hecho. Y en cuanto a componentes de entidades, es dudoso que por ejemplo pueda separarse la palma de la mano, el filo del cuchillo, la nuca de la cabeza, el sistema nervioso del cuerpo o la trama del relato.

    De todos modos, lo relevante a efectos de representación es que se trata entidades (temporales o espaciales en este caso) que se conciben como incluidas en otras que las comprenden; y que las entidades incluidas no forman parte de un conjunto de entidades de idéntico tipo que conjuntamente constituyen la entidad inclusiva. Por tanto la relación corresponde al esquema componente-entidad. Por otra parte, otro tipo de relaciones que pueden considerarse pertenecientes a esta misma área, como [día] - [mes] o [provincia] - [estado], dado que en estos casos se define una relación de entidad global a multiplicidad de elementos del mismo tipo, son clasificables como relaciones elemento-multiplicidad.

    Las relaciones Fase-Actividad de WCH1987 y CH1988 -que se realizan en el lenguaje principalmente mediante verbos (p.e. 'viajar'-'llegar'), pero también pueden expresarse mediante nombres deverbales ('viaje'-'llegada')- son análogas a las anteriores, en especial a Área-Tiempo de CH1988, por lo que no cabe postular pertenencia a un esquema merológico distinto.

    Quedan por analizar las relaciones de Representación ('persona'-'retrato') y Evento-Rasgo ('boda'-'novia') de CH1988. No entraré en ellas porque no creo que sea claro que se puedan considerar relaciones merológicas -de hecho Winston et al. (1987) no las incluyen en su modelo, y Chaffin y Herrmann (1988) las consideran únicamente similares a la relación parte-todo-. Posiblemente para incluirlas dentro de las relaciones parte-todo hubiera que considerar como 'todo' la noción más general habitualmente denominada guión o script, comprensivo de todo tipo de expectativas y actantes asociados a una situación.

    Como nota final, debe apuntarse que las consideraciones realizadas hasta aquí son asimismo aplicables a los tipos básicos de relación de Cruse (1986) -ver §2.1.3-. En cuanto a sus análisis sobre factores de interferencia de niveles y sobre tipos de cohesión, queda fuera de mi objetivo en este trabajo el realizar representaciones diferenciadas para dichos matices semánticos. Las diferencias de tipo de cohesión (partes unidas vs. partes integrales, p.e. dedo-mano vs. palma-mano; y partes sistémicas vs. partes segmentales, p.e. arterias-cuerpo vs. cabeza-cuerpo) no se verán reflejadas en la representación -la totalidad de los ejemplos anteriores se considerarán componente-entidad, sin más matices-. Para la representación de opcionalidad de relación y factores similares asumo las soluciones de EuroWordNet (Climent et al. 1996; ver §3), pero no las trataré en lo subsiguiente.

    Asimismo, también queda fuera del alcance de este trabajo la definición de mecanismos de computación de la transitividad de las relaciones de parte. Asumo al respecto el principio formulado por Winston et al. (1987) e implementado en WordNet (ver §3), que admite la transitividad dentro de un mismo tipo de relación parte-todo, así como la herencia por vía taxonómica de las relaciones de parte.

    Así pues, como resumen de la sección, remarcaré nuevamente que, como he intentado argumentar, las relaciones parte-todo que diversos autores han propuesto, son representables en un lexicón mediante tres esquemas fundamentales: componente-entidad, elemento-multiplicidad y materia-entidad. Ulteriores diferencias, que han motivado la postulación de múltiples tipos y subtipos diferenciados de relación, son inferibles a partir de los tipos de entidad (es decir, de la estructura jerárquica del lexicón), o a partir del número de relaciones merológicas de un mismo tipo que las entidades establecen.
 

4.2.2 Extracción de relaciones meronímicas

    A modo de aplicación de lo discutido hasta aquí en esta sección se han realizado dos experimentos de extracción de relaciones parte-todo de los tipos fundamentales definidos a partir de fuentes preexistentes de información léxico-semántica: el corpus de definiciones del diccionario monolingüe VOX (1987) por una parte -método 1-; y la red semántica WordNet y diccionarios bilingües Inglés-Español y Español-Inglés -método 2-. En el apéndice 1 se presentan ambos experimentos y una muestra de los datos obtenidos.

    De estas aproximaciones resultan los siguientes porcentajes para cada esquema merológico básico:
 

    esquema     método 1 (dicc. monolingüe)     método 2 (WN + bilingües)
    parte-entidad

48 %

88%

    elemento-multiplicidad

35 %

9%

    materia-entidad

16 %

3 %

    TOTAL

100 %

100 %

Tabla IV.3: Porcentajes por tipo de esquema en experimentos
de extracción de relaciones meronímicas

    Pese a que los datos anteriores deben ser tomados con prevención debido al carácter de primera aproximación de los experimentos efectuados, parece claro que el tipo de esquema más común en el lenguaje (o como mínimo en la codificación del léxico en las fuentes utilizadas) es el parte-entidad; siendo con diferencia materia-entidad el esquema menos utilizado.

    Este último dato resulta extraño ya que parece evidente que cualquier entidad, o como mínimo cualquier entidad física, está hecha de algún tipo de materia. Sin embargo en muchos casos éste es considerado un tipo de conocimiento general sobreentendido que no es preciso reflejar en bases de conocimiento léxico. Por otra parte, también es común que este conocimiento no tenga reflejo léxico diferenciado, sino que se utiliza el mismo lexema para denotar una entidad y la materia de que se compone, mediante extensión de significado. Por ejemplo, el conocimiento común indica que [un espárrago] está hecho de [espárrago]; perteneciendo ulteriores precisiones relativas a composición a áreas de léxico especializado (p.e., en el caso del espárrago, botánica, biología).

    Por otra parte los bajos porcentajes en relaciones importadas en WordNet son achacables en gran medida, además, a la propia estructura de WordNet, en la que, al parecer se ha prestado poca atención a dicho tipo de relación.

    Los bajos porcentajes de elemento-multiplicidad pueden considerarse normales y un reflejo de la existencia de un menor número de tipos de conceptos relativos a entidades múltiples en relación al conjunto de masas y entidades no granulares.

4.3 Recapitulación


     En este capítulo he expuesto diversos problemas a los que pretendo dar una solución en el marco de un lexicón computacional. A fin de situar el fenómeno he examinado las nociones de categorización, indivuación y lexicalización, que he definido como funciones de correspondencia entre tres niveles epistemológicos: el mundo real, el sistema conceptual y el lenguaje.

    El análisis de la individuación (referencia diferenciada de entidades del mundo mediante expresiones lingüísticas) ha revelado que un factor clave a tener en cuenta en la representación semántica es la posibilidad de que se den, tanto a nivel lingüístico como referencial, alternancias de tipo delimitado/no delimitado: entidad/materia en el nivel de los referentes, o discreto/cumulativo en el nivel de las expresiones.

    El hecho de que la individuación y la expresión de conceptos se realicen en el lenguaje tanto de forma léxica como sintagmática implica que la información parte-todo, siendo una función de inclusión entre conceptos o categorías de entidades, subyazca de igual modo tanto a las denotaciones léxicas como a las multiléxicas; en consecuencia, es preciso que se codifique en las representaciones formales de ambos tipos de estructuras.

    La representación de la información merológica contenida en expresiones complejas no se ha tratado de forma suficiente, por lo que será el objetivo de los capítulos subsiguientes. La contenida en los lexemas ha sido abordada de diversos modos, dando lugar a múltiples clasificaciones de relaciones meronímicas. En este capítulo he formulado un análisis unificado que permite representar en el léxico los diversos tipos de relaciones meronímicas postuladas mediante tres únicos esquemas merológicos básicos: componente-entidad, elemento-multiplicidad y materia-entidad. Estos esquemas son representables en términos de los rasgos binarios propuestos por Jackendoff (1991) ± delimitación y ±granularidad.

Estos tres esquemas servirán no únicamente para dar cuenta de la clasificación de las relaciones parte-todo entre unidades léxicas (o meronimia, respecto al cual se ha realizado el trabajo de extracción de relaciones detallado en la tabla IV.3 y el apéndice 1), sino también de las que subyacen a expresiones complejas, como los sintagmas partitivos, los cuáles se analizarán con detalle en el capítulo siguiente.

5. Individuación mediante construcciones partitivas.


5.1 Nombres partitivos: aproximación funcionalista y similitud con clasificadores
5.2 Propiedades generales de los nombres y grupos partitivos
5.3 Conclusiones


    Hemos visto hasta aquí cómo las relaciones de parte son relaciones de inclusión que se establecen entre conceptos, y he postulado que las mismas son representables mediante tres esquemas merológicos básicos: componente-entidad, elemento-multiplicidad y materia-entidad. Tambien hemos visto que entidades, partes de entidades, y grupos de entidades, son expresables lingüísticamente de dos modos: lexicalizado y sintagmático. En el primer caso la expresión lingüística se construye alrededor de un nombre plenamente referencial (o predicativo), y en el segundo alrededor de grupos nominales. Uno de los tipos de grupos nominales individuadores, íntimamente relacionados con la información parte-todo, son los grupos partitivos: grupos que se construyen mediante un nombre (relacional) partitivo, la preposición 'de', y un nombre predicativo. Los grupos partitivos están directamente implicados en la construcción del conocimiento parte-todo dado que individuan una entidad de modo que de forma directa se establece una relación merológica entre el concepto relativo a ésta y otro concepto más inclusivo.

    Habiendo postulado que los tres esquemas merológicos propuestos dan cuenta de las relaciones de parte entre conceptos, y dado que los conceptos son expresables de forma léxica o de forma sintagmática, la consecuencia es que las relaciones de parte que subyacen a los sintagmas partitivos son -del mismo modo que lo es la meronimia o relaciones de parte entre conceptos lexicalizados- representables a partir de dichos tres esquemas. Considérense a guisa de ejemplo los casos de la Fig. V.1:
 


Fig. V.1: Grupos partitivos y relaciones merológicas
 

    Los nombres partitivos construyen conceptos que, como mínimo, individuan una entidad y expresan una relación merológica; pero a menudo, por supuesto, no únicamente expresan ese tipo de conocimiento semántico. De los casos de la Fig. V.1, por ejemplo, podemos decir que [trozo de pan] , probablemente, tan sólo expresa individuación y relación entidad-materia. Sin embargo, [columna de soldados] , además, transmite información relativa a la disposición de los soldados; y [punta de flecha] , añade a la información de ser parte de flecha, la de ser la parte situada en el extremo exterior de la misma. Resulta evidente que una parte notable de la información contenida en el grupo partitivo es aportada por su núcleo sintáctico: el nombre partitivo. En este capítulo analizaré las diversas implicaciones semánticas de los grupos partitivos en general, y de los nombres partitivos en particular.

    De modo específico, como he apuntado en el capítulo anterior, existen lenguas con un funcionamiento especial relativo a la individuación de entidades: las lenguas con clasificadores. Veremos en este capítulo cómo los lexemas clasificadores realizan en dichas lenguas una función semántica análoga a la de los nombres partitivos en castellano. Y comprobaremos asimismo como la tipificación de los clasificadores es utilizable para realizar la de los nombres partitivos, arrojando luz sobre los tipos de información que -aparte de la de individuación- ambos aportan al sintagma en el que intervienen.

5.1 Nombres partitivos: aproximación funcionalista
y similitud con clasificadores


    Una especificación funcional de los nombres partitivos la hallamos para el inglés -pero dada la similitud entre ambas lenguas, es aplicable también en gran parte al español- en la gramática Collins Cobuild (Sinclair, edt., 1990). Veamos someramente a continuación el análisis que realiza de este tipo de lexemas.

    Como cuestión previa hay que tener en cuenta las nociones definidas en Sinclair (1990) de nombre contable, incontable y de masa (count, uncount y mass). Se considera contables a los nombres "que refieren a gente o cosas que pueden ser contadas", por lo que pueden combinar con numerales ('dos', 'tres'); e incontables a "los que refieren a cosas generales tales como cualidades, substancias, procesos..." (p.e. 'inteligencia', 'comida', 'agricultura', 'muerte', 'felicidad') y no pueden combinar con numerales.

    Tal diferencia se corresponde en inglés con diversas especificaciones de concordancia, determinación y cuantificación (alternancias 'much'/'many', 'some'/'any' etc.) que no es preciso detallar aquí. Se considera nombres de masa (mass) a aquellos en los que "cuando se está seguro de que el oyente entenderá que aquello que es referido es una cantidad de algo, no es necesario usar un cuantificador"; p.e. 'café' en expresiones como 'tres cafés', en que la información estricta 'tres tazas de café', se sobreentiende. Sinclair asume que es habitual que se produzca indeterminación sobre si un nombre es o no contable, dependiendo de diversos matices semánticos. Un caso típico de dicha alternancia se da cuando un nombre "puede ser no contable cuando se refiere a una cosa en general, y contable cuando se refiere a una instancia particular de la misma", p.e. 'éxito' vs. 'un éxito'.

    Entrando ya en el caso de los nombres partitivos, la aproximación de Sinclair (op. cit.) parte del supuesto de que 'cuando se quiere hablar de una cantidad particular de algo, puede usarse una estructura partitiva, la cual consiste en un particular partitivo unido por 'of' ('de') a otro nombre. Los partitivos son todos nombres contables.'

    Y detalla los siguientes tipos o usos de construcciones partitivas:

    • Con nombres incontables se usan partitivos como grain ('grano'), mountain ('montaña'), bit ('pedazo'), piece ('fragmento', 'trozo'), sheet ('lámina'), pile, heap ('montón'), slice ('rebanada', 'trozo'), etc.

    • Algunos de los partitivos antes referidos (p.e. heap o mountain) también se usan con nombres en plural cuando refieren a cosas que en conjunto forman una masa: a heap of stones ('un montón de piedras').

    • Muchos nombres que indican la forma de una cantidad de algo pueden ser también partitivos y combinan con nombres incontables y plurales: a ball of wool ('una bola de lana'), columns of smoke ('columnas de humo').

    • Muchos nombres que indican forma y movimiento tienen también dicho uso: a jet of water ('un chorro de agua')

    • Muchos nombres que refieren a grupos, como group ('grupo'), gang ('banda'), team ('equipo') o herd ('rebaño'), también se usan como partitivos, y combinan con nombres en plural: 'un equipo de inspectores'. Dicho uso es muy productivo en inglés ya que puede usarse de tal modo cualquier nombre que refiera a un grupo: 'un ejército de voluntarios'.

    • Los nombres que refieren a medidas (área, volumen, peso) pueden usarse también como partitivos: 'metro', 'kilo', 'litro', etc. Los que refieren a longitud combinan con nombres incontables ('dos metros de tela') y los que refieren a peso con incontables y plurales ('dos kilos de fresas', 'tres kilos de queso').

    • Se usan estructuras partitivas cuando se quiere hacer referencia a un contenedor al mismo tiempo que al contenido de dicho contenedor, p.e. 'un vaso de agua' para referirse a un objeto ('vaso') lleno de una sustancia ('agua'). Dichas estructuras también sirven para referirse únicamente al contenido ('un vaso de agua', con referencia únicamente al contenido 'agua').

    • A veces puede usarse un nombre de masa en lugar de la construcción partitiva ('un café' por 'una taza de café').

    • Partitivos como part ('parte'), portion ('porción', 'trozo'), section ('sección') o segment ('segmento') se usan para hablar de partes o fracciones de cosas particulares ('una parte de mi vida', 'diversos segmentos de la sociedad').

    • Partitivos como article ('artículo'), piece o item ('ítem', 'unidad') se usan junto con nombres incontables para referirse a una unidad en particular de cosas de un dierto tipo: 'a piece of news' ('una noticia')

    • El partitivo pair se utiliza para referirse a plurales que refieren a cosas que constan de dos partes o que suelen presentarse en pares: 'un par de calcetines', 'un par de medias'.

    • Finalmente, es muy productivo el uso como partitivo de nombres de grupo que indiquen cantidad o naturaleza de las cosas, combinados con otro nombre de grupo que indique de qué cosa se trata, para hablar de una cantidad de algo, del área que algo ocupa, o para especificar otros rasgos que ésta posea. Por ejemplo 'un bosque de pinos' para referirse a una extensa área de pinos; o 'una marabunta de manifestantes' para referirse a una gran cantidad de manifestantes.

    Como veremos en la siguiente sección, desde mi punto de vista esta aproximación tradicional es mejorable a partir de la comparación del mecanismo de los nombres partitivos en el inglés o el español con el de los clasificadores en otras lenguas.
 

    Clasificadores

    Como hemos visto, la aproximación de Sinclair (op. cit.) parte de la consideración de los partitivos como cuantificadores. La misma visión es compartida por Langacker (1991), quien considera que son cuantificadores relativos, en el siguiente sentido:

    'Un cuantificador relativo recibe ese nombre porque especifica una cantidad en relación a una masa de referencia; en el caso por defecto dicha massa de referencia consiste en la instanciación máxima de la categoría pertinente (es decir, su extensión total en todos los mundos concebibles)'

Langacker (op. cit.)

    Sin embargo, menciona asismismo Sinclair que los partitivos comportan a menudo otro tipo de nociones semánticas, aparte de la de cantidad, como p.e. forma, naturaleza de las cosas. A tal respecto Lyons (1977) hace notar que los nombres partitivos guardan similitud con los clasificadores en ciertas familias de lenguas, dado que, de algún modo, clasifican la entidad denotada a partir de algunas de sus propiedades.

    La observación de Lyons merece ser examinada con detalle puesto que, como veremos, resultará de gran ayuda para comprender la gran diversidad de información semántica que puede expresarse mediante un partitivo.

    Veamos pues a continuación el caso de las lenguas con clasificadores, a partir de las cuáles observaremos como ciertas funciones semánticas que éstos realizan en las lenguas que disponen de ellos son realizadas por los nombres partitivos y análogos en español y lenguas afines. Presentaré la tipología de clasificadores realizada por Allan (1977) y prestaré atención al caso del japonés, dando cuenta del trabajo realizado por Bond et al. (1996) para el tratamiento del fenómeno en el marco de trabajo de la traducción automática de dicha lengua al inglés.

     Lyons (1977) refiere que muchas lenguas -no las indoeuropeas, quizá por eso se le ha prestado poca atención al fenómeno- disponen para la construcción de expresiones referenciales, aparte de determinadores y cuantificadores, de un tercer tipo de especificador del nombre: los clasificadores. Tales unidades lingüísticas tienen en principio las siguientes características definitorias (cf. Allan, 1977):

    • Se realizan como morfemas, como afijos de especificadores de un nombre, de forma que el nombre no puede interponerse en la realización superficial entre el clasificador y el especificador. Las únicas combinaciones observadas entre estos tres elementos léxicos en las lenguas con clasificadores son los siguientes: E-C-N (especificador-clasificador-nombre), N-E-C, C-E-N y N-C-E.

    • Tienen significado autónomo en el sentido en que denotan ciertas características destacables, percibidas o imputables, de la entidad a la cual refiere el nombre a que van asociados

    Para Lyons (op. cit.) existen básicamente dos tipos de clasificadores:

    • clasificadores clasales, semánticamente especializados en la referencia a tipos de entidades (p.e. seres humanos, animales, plantas, objetos planos, objetos redondos)

    • clasificadores mensurales, que individualizan en términos de cantidad (de forma similar a 'litro' en 'dos litros de agua').

    Dentro de los primeros cabe destacar la presencia en la mayoría de lenguas con clasificadores de uno semánticamente neutro (equivalente al inglés 'piece') no especializado en la referencia a ningún tipo de entidad en particular. En líneas generales, los clasificadores clasales aportan el significado de tipo de entidad basándose en su forma y nociones afines; 'un libro' podría ser parafraseado, p.e. en chino mandarín, como [una - entidad_plana - libro] . Los clasificadores mensurales, por su parte, aportan un significado de cantidad más o menos convencionalizada -aproximadamente, [dosis] -. Es asimismo general la existencia de clasificadores especializados en la referencia a cualquier tipo de pluralidad o colectividad que coocurren con demostrativos, pero no con numerales.

    Ilustra Lyons el fenómeno mediante datos del tzleltal, lengua maya hablada en México, (37a,b) debidos a Berlin (1968) y del chino mandarín (37c-f), debidos a Chao (1968).

    (37)
    a. os-tehk te [tres-planta árbol] 'tres árboles'
    b. can-tul winik [cuatro-entidad_humana hombre] 'cuatro hombres'
    c. i ben shu [un entidad_plana libro] 'un libro'
    d. san ben shu [tres entidad_plana libro] 'tres libros'
    e. che ben shu [este entidad_plana libro] 'este libro'
    f. che hsie shu [este colectividad libro] 'estos libros'

    (37a,b,c,d,e) ilustran el empleo de clasificadores clasales, en el tzletal exclusivamente con numerales y en el caso del chino mandarín con numerales y demostrativos. 'Hsie', en (37f), es el clasificador pluralizador o colectivizador del chino mandarín. No aporta Lyons ningún ejemplo de frase con clasificador neutro; sin embargo informa de que en chino mandarín se emplea el clasificador 'ge' con el valor genérico de [entidad] o [cosa] y que en muchas lenguas su uso queda restringido a entidades no personales o incluso inanimadas. Además de en los contextos anteriores, los clasificadores "pueden utilizarse con una función pronominal o cuasi-pronominal en la referencia deíctica o anafórica" (Lyons, op.cit).

    De forma más precisa, Allan (1977), da cuenta de cuatro tipos de lenguas con clasificadores y de siete tipos de clasificación, los cuales describiremos a continuación.

    Los cuatro tipos de lenguas con clasificadores son los siguientes:

    • de clasificadores numerales
    • de clasificadores de concordancia
    • de clasificadores de predicado
    • de clasificadores intralocativos

    El primer tipo, lenguas de clasificadores numerales, es el más común y paradigmático. En ellas, los clasificadores son obligatorios en la mayor parte de las expresiones de cantidad -de ahí su nombre; sin embargo, el clasificador en sí no aporta información semántica de cantidad, sino de tipo de entidad cuantificada-. Suceden asimismo en expresiones anafóricas y deícticas. Veamos los siguientes ejemplos del tailandés:

    (38)
    a. khru. lâ.j khon [maestro tres persona] = 'tres maestros'
    b. mâ. sì. tua [perro cuatro cuerpo] = 'cuatro perros'
    c. mâ. tua nán [perro cuerpo ese] = 'ese perro'
    d. tua nán [cuerpo ese] = 'ése (animal, objeto, etc.)'
    e. sì. tua [cuatro cuerpo] = 'cuatro (animales, objetos, etc.)'

    En las lenguas con clasificadores de concordancia los clasificadores son morfemas que se afijan no sólo al nombre sino además a sus modificadores y predicados, marcando la concordancia entre todos ellos. P.e. nótese la siguiente frase del swahili en dónde 'vi' es el clasificador plural para objetos inanimados:

    (39)
    visu vidogo viwili hivi ambavio nilivinunua ni vikali sana
    [vi+pequeño vi+dos vi+ese vi+que vi+yo+compré son vi+afilado muy]
    'esos dos cuchillos pequeños que compré son afilados'

    En las lenguas con clasificadores de predicado (observación debida a Hoijer, 1945, cf. Allan, 1977) los verbos de movimiento y locación consisten de dos partes: un tema (p.e. 'estar') más un afijo que varía de acuerdo con ciertas características de las entidades que participan en la acción o situación. Veamos los tres ejemplos del navajo en (40) en dónde un verbo aproximadamente equivalente a 'estar' o 'descansar en un lugar' se forma mediante el tema , con significado estativo perfectivo, al que se le afijan clasificadores diferentes dependiendo de matices atribuibles al nombre que ejerce de sujeto, béésò ('dinero'), en concreto dependiendo de si el dinero en cuestión aparece en forma de [una moneda] , [un billete] o [calderilla] (=muchas monedas):

    (40)
    a. béésò sìPá [dinero está+entidad_redonda] = 'Hay una moneda' (sobreentendido 'ahí')
    b. béésò sìnìl [dinero está+colección] = 'Hay calderilla/algo de dinero'
    c. béésò sìltsòòz [dinero está+entidad_plana-y-flexible] = 'Hay un billete'

    Finalmente, en las en las lenguas con clasificadores intralocativos los clasificadores se realizan como afijos de las expresiones locativas que obligatoriamente acompañan a los nombres en diversos entornos pragmáticos (tales como 'cosas que están a la vista', 'cosas que entran o salen del campo de visión', etc.). Tales clasificadores conllevan el contenido semántico de nociones generalmente relacionadas con la forma o la situación de las cosas denotadas por los nombres en cuestión, como por ejemplo [vertical] , [horizontal] , [notoriamente tridimensional] , etc. Lenguajes de este tipo son el esquimal y el dyirbal.

    El número de clasificadores de que dispone cada lengua es muy diverso, sin embargo, para Allan (1977), se pueden agrupar de forma genérica de acuerdo con el tipo de clasificación que realizan en los siete tipos que se detallarán a continuación. Téngase en cuenta sin embargo que dichos tipos y sus subtipos pueden y suelen mezclarse entre sí de modo que existen clasificadores que incorporan componentes semánticos de varios de ellos. Hace notar Allan que los tipos de clasificadores que ha detectado y postula se corresponden de forma notoria con las cualidades primarias de los cuerpos de Locke (1689): solidity ('consistencia'), extension (nociones de forma y tamaño), motion or rest (movimiento o 'descanso'), number (número, cantidad) y figure (también nociones asociadas a forma y aspecto). Lyons (1977) por su parte considera que los clasificadores suelen corresponder a los tradicionalmente llamados tipos naturales (cf. Putnam, 1970). Los siete tipos definidos por Allan son: esencia de la entidad, forma, consistencia, tamaño, lugar, disposición y cantidad. A continuación los examinaremos someramente citando sus subtipos y algunos ejemplos de entidades que clasifican:

    • esencia de la entidad. Es el más habitual, correspondiendo a cualidades intrínsecas de los denotandos. Es subclasificable en: animacidad, inanimacidad y abstracción-verbalidad. Es asimismo habitual en muchas lenguas el disponer de un clasificador general o residual usado para todo tipo de objetos no clasificables directamente mediante el resto de clasificadores de que dispone la lengua en cuestión.
 

    • animacidad. Probablemente todas las lenguas que tienen clasificadores de 'esencia de la entidad' clasifican las entidades en animadas y no animadas. En algunos casos simplemente existe un clasificador para entidades animadas, pero es más habitual que existan clasificadores distintos para seres humanos y animales. Dentro de los clasificadores para humanos, algunas lenguas establecen diferenciaciones de tipo honorífico, y muchas tienen clasificadores diferenciados para hombres y mujeres (incluso algunas tienen un clasificador para hombres e incluyen a las mujeres bien en la clase de animales bien en la general).

    • inanimacidad. Existe un gran número de subtipos de clasificadores para objetos inanimados. El más común es el clasificador para árboles (incluyendo a menudo objetos de madera), que suele estar relacionado con la clase de objetos alargados. Otras clases muy comunes son: partes del cuerpo, comida, herramientas, líquidos (incluyendo a menudo ríos etc.), objetos puntiagudos o afilados y barcas (muy usado en un sentido primigenio de vehículo: curiosamente en hausa nombres como 'tren', 'camión' o 'avión' son compuestos a partir del clasificador para botes o barcas).

    • abstracción-verbalidad. Es una categorización poco usada. Sólo el vietnamita y las lenguas bantús tienen clasificadores para nombres abstractos o que denotan acciones.
 

    • forma. Es subclasificable a partir de las nociones de dimensionalidad y no dimensionalidad.
 

    • dimensionalidad. Existen gran cantidad de clasificadores asociados a las nociones de alargado, plano y redondo. Los clasificadores para objetos alargados suelen asociarse con objetos con forma de cuerda y con árboles y objetos de madera, combinando a menudo con nociones relativas a la consistencia de las entidades: alargado+flexible (cuerdas etc.), alargado+rígido (palos, etc.), plano+flexible (tejidos y objetos similares), plano+rígido (planchas, tablones...).

    • no dimensionalidad. Los subtipos más notables de clasificadores basados en la forma pero no directamente en la dimensionalidad de los objetos son los que atañen a objetos prominentemente curvados (colinas, montones, cuernos, uñas...) y los que clasifican contenedores y similares (botellas, pipas, etc.). En algunas lenguas pueden combinar con clasificadores para objetos anulares (anillos, adornos, y diversos tipos de agujeros y huecos)
 

    • consistencia, con tres subtipos: flexibile, rígido y no discreto. Los dos primeros suelen darse, como hemos visto, en combinación con nociones de forma. El tercero clasifica sustancias o masas informes (barro, líquidos, etc.)

    • tamaño, con los subtipos grande y pequeño, que suelen combinar con nociones de forma, e incluso de esencia de las entidades, p.e. para distinguir animales grandes de animales pequeños.

    • lugar. Las lenguas bantúes tienen prefijos locativos de concordancia que se dividen en prefijos de estado inherente y de locación contingente. Diversas lenguas, además, disponen de clasificadores para parcelas de terreno, campos, países, pueblos, etc. Sin embargo, éstos podrían considerarse como pertenecientes al tipo de 'esencia de la entidad'.

    • disposición. Se han detectado clasificadores que agrupan objetos de acuerdo con su configuración; de tres tipos: configuración no inherente (cosas plegadas, como piezas de tela, rollos, ovillos, p.e. de cuerda, rizos, etc.); posición específica (objetos dispuestos en perpendicular, en horizontal, o agrupados en paralelo, en fila, ...); y distribución específica no inherente, una categoría subsidiaria que intersecta con las de cantidad: montón, rebaño, etc.

    • cantidad. Este tipo agrupa gran número de clasificadores en muy diversos subtipos que, como se ha dicho, pueden combinar con otros tipos de clasificadores. Subtipos notables son: colecciones (rebaño, par, racimo, grupo, manada, enjambre); volúmenes (cesto, puñado); de instancia (tipo, clase); partitivos (unidad, cabeza, mitad, uno de un par); medidas (de dimensión, de peso, de tiempo). Debe destacarse que es prácticamente universal el uso de medidas basadas en el cuerpo humano: pies, palmos, brazos, bocados, puñados, etc. Finalmente, de forma similar a lo que sucede en las lenguas que nos son más familiares, las lenguas con clasificadores de concordancia y de predicado disponen de clasificadores de número gramatical (singular, plural, dual, colectivos incontables, masas, colecciones ordenadas...).

    En las anteriores clasificaciones y subclasificaciones hemos podido reconocer en los ejemplos de clasificadores multitud de equivalentes a los nombres que en español ocurren en los sintagmas del tipo 'un X de FN', haciéndose evidente que su uso en dicho tipo de lenguas es el recurso utilizado para diversos modos de construcción de la referencia que en las lenguas indoeuropeas se realizan mediante otro tipo de mecanismos. Tal constatación, por una parte, abre un camino sumamente sugerente hacia la comprensión de la naturaleza de ciertos aspectos de la semántica de los nominales -y en definitiva de la comunicación lingüística- que pueden considerarse, si no universales, sí notablemente independientes de lenguas o familias de lenguas específicas; por otra parte, plantea problemas muy interesantes para la formalización y el procesamiento del lenguaje, siendo un ejemplo obvio el de la traducción (especialmente la traducción automática) de sintagmas nominales entre lenguas con clasificadores y lenguas sin clasificadores.

    En dicho campo, Bond et al. (1996) exponen los problemas más notables que plantean las diferencias entre el japonés -una lengua del tipo de clasificadores numerales, cf. Allan (1977)- y el inglés: (i) el japonés no dispone de una categoría equivalente a los determinantes en inglés; (ii) tampoco dispone de marca gramatical de número; y (iii) en japonés los numerales no pueden modificar directamente a los nombres comunes -se precisa de un clasificador afijado al numeral-.

    El efecto es que, por ejemplo, el equivalente del sintagma 'one dog' ('un perro') sea en japonés 1-hiki-no-inu (41a), en dónde hiki es el clasificador para [animales pequeños excepto conejos y pájaros] , no equivale a la preposición 'of' ('de'), e inu es la traducción de 'dog' ('perro') -sin marca de número-. Sin embargo, no todas las construcciones con clasificador de tal tipo son traducibles al inglés por numeral+nombre (obviándose el clasificador): las características del nombre en inglés fuerzan traducciones mediante sintagmas partitivos, como en (41b,c), con la particularidad de que el nombre del todo puede estar, en inglés, en singular o en plural (diferencia no inferible a partir del japonés).

    (41)
    a. 1-hiki-no-inu [1-animal-de-perro] = 'one dog' ('un perro')
    b. 1-tsubu-no-kome [1-grano-de-arroz] = 'one grain of rice' ('un grano de arroz')
    c. 1-hako-no-pen [1-caja-de-pluma] = 'one box of pens' ('una caja de plumas')

    Para solventar este tipo de desajustes en la traducción al inglés de sintagmas nominales con clasificador en japonés, Bond et al. (1996) organizan los clasificadores del japonés en siete grupos que asocian a traducciones típicas en partitivos del inglés y a restricciones de traducción relativas a la contabilidad del nombre inglés para el todo como por ejemplo:
 

   tipo     ejemplo     traducción     restricción
unidad- general     -tsu     piece     clasificador por defecto si nombre inglés incontable; no traducir si nombre inglés es contable
unidad- especial     -kire     slice     traducir clasificador y forzar nombre inglés a incontable

    Como puede verse se trata de una aproximación fundamentalmente aplicada y basada en la casuística, que sin embargo topa con importantes problemas de decidibilidad, principalmente en cuanto a la capacidad combinatoria (restricciones selectivas) de los partitivos en relación con la contabilidad o incontabilidad y el número gramatical de los nombres del todo en inglés (F. Bond, comunicación personal).
 
 

    Relación entre clasificadores y nombres partitivos

    Como hablantes de lenguas de distinto tipo se nos plantean ante el caso de los clasificadores dos cuestiones interrelacionadas: en primer lugar, ¿para qué sirven exactamente los clasificadores?; y en segundo, ¿qué mecanismos utiliza el español (y lenguas relacionadas) para realizar las funciones que otras lenguas realizan mediante clasificadores?

    La respuesta a la primera cuestión es en parte paradójica: la clasificación no es la función primordial de los clasificadores.

    En cambio, la respuesta a la segunda, es, en cierto modo, obvia: en los casos en que es necesario, la función de los clasificadores del japonés o el swahili la realizan en español los clasificadores del español.

    Analicemos la primera cuestión. Por supuesto que los clasificadores sirven para clasificar: corresponden a una clasificación de las entidades en tipos, ligada en muchos casos a convenciones culturales que a priori nos pueden resultar, como mínimo, exóticas. Sin embargo no parece que clasificar entidades en tipos sea algo de inexcusable utilidad para referirse a entidades comunes y corrientes, como por ejemplo, para referirse a un libro o a cuatro perros. Es de esperar de que el conocimiento del hablante ya comprenda la información de que los libros son cosas aproximadamente planas y los perros son animales. Sin embargo, como hemos visto antes (37c, 41a), los equivalentes en chino mandarín y japonés de 'un libro' y 'cuatro perros' incorporan clasificadores para, respectivamente, [entidad plana] y [animal] .

    Se puede apreciar mejor su utilidad cuando se considera que los clasificadores (en las lenguas de clasificadores numerales) suelen tener función anafórica y deíctica. Recuérdense los ejemplos del tailandés en (38d,e), en dónde los pronombres 'ése' y 'cuatro' (refiriéndose, por ejemplo, a un animal) se construyen mediante pares demostrativo-clasificador y numeral-clasificador, parafraseables en dichos ejemplos por 'ese' + 'cuerpo' y 'cuatro' + 'cuerpo'. La especificación aportada por el clasificador, en cuanto que redundante o rememorativa, es susceptible de resultar de gran utilidad en la desambiguación del referente; correspondiendo exactamente al recurso, habitual en español -cuando el contexto no es suficiente para fijar con exactitud la referencia- de repetición del nombre o utilización de otro nombre taxonómicamente relacionado con el que es referido anafóricamente (o a la utilización alternativa de los sufijos '-one' o '-thing' en inglés).

    Sin embargo, para comprender totalmente la funcionalidad de los clasificadores, debe enmarcarse el fenómeno en la globalidad del sistema nominal característico de las lenguas que disponen de ellos. Para tal fin consideremos el caso de la cuantificación. Existen diversos modos de cuantificar, siendo los fundamentales los relativos a número de unidades discretas de entidades y a cantidades de una masa o acumulación indiferenciada (cf. Bunt, 1981, vid. §4.1.2), y es preciso que el modo de cuantificación se especifique mediante algún mecanismo lingúístico. En el caso del español, cuando un nombre es especificado mediante un numeral u otro determinante, dicho nombre se interpreta por defecto en términos de unidades discretas e individualizadas (gramaticalmente contables). Por ejemplo, sintagmas como 'una sopa' o 'una cerveza' se interpretan por defecto como dosis convencionales discretas de dichas sustancias. Y en el caso de que para la naturaleza del significado a comunicar el tipo no marcado de cuantificación resulte impreciso, incompleto, o no aplicable, se recurre a la utilización de sintagmas partitivos (o análogos): 'un plato de sopa', 'una jarra de cerveza'.

    En las lenguas con clasificadores, por el contrario, los nombres no denotan por defecto (es decir, en ausencia del contexto lingüístico adecuado) entidades discretas o enumerables. Por ejemplo, en japonés (ver 41a), 'inu' -[perro] - no incorpora en sí el significado de animal individual. Según Lyons (1977), en las lenguas con clasificadores, la mayoría de los nombres "pueden construirse con referencia (colectiva o distributivamente) a una clase de individuos, o bien a una materia o substancia". En otras palabras, en tales lenguas no hay diferencia gramatical entre nombres contables y no contables. Por tal razón, las funciones de individuación y enumeración deben ser marcadas por otro tipo de mecanismos: los clasificadores.

    En consecuencia, la función principal de los clasificadores es la construcción de expresiones referenciales -es decir, la individuación- por combinación con unidades lingüísticas denotadoras de clases de individuos o de masas. Ello es debido a que, en las lenguas con clasificadores, los lexemas no incorporan en ningún caso el significado de entidad individual, a diferencia de lo que ocurre con muchos nombres del español (y en general las lenguas de origen indoeuropeo), en los que la noción de individualidad se sobreentiende (está lexicalizada).

    Así, 'perro' en japonés no refiere por defecto a una entidad individual, y es parafraseable por 'aquello que es perro' -siendo equiparable, por ejemplo, a 'sopa' en español-. Por consiguiente, para referirse a una unidad, varias unidades, o a una cierta colección de entidades del tipo [perro] , es preciso construir un sintagma con clasificador, en tanto en cuanto el clasificador actúa como individuador, o constructor de una entidad diferenciada. Por tanto, lo que en español es referido como 'un perro', 'tres perros' o 'una jauría de perros', se compondrá en lenguas con clasificadores de forma similar a [un-entidad-perro] , [tres-entidad-perro] o [un-coleccion-perro] .

    En español las dos primeras paráfrasis suenan extrañas, pues nuestros lexemas del tipo 'perro' ya llevan incorporado en su significado la noción de entidad individual. La tercera ya nos resulta más familiar, pues sí utilizamos palabras, como 'rebaño', 'jauría', etc. que comportan el significado de grupo o colección como entidad diferenciada, significado que, evidentemente, no está incluido en el lexema 'perro'.

    La segunda cuestión que se planteaba era: ¿cómo solucionan las lenguas sin clasificadores lo que las lenguas con clasificadores solucionan mediante clasificadores?. Y aventuraba que lo hacían del mismo modo: mediante clasificadores -aunque en nuestra tradición lingüística los denominamos nombres partitivos-.

    Pero tal hipótesis debe precisarse: se realiza mediante clasificadores (partitivos), cuando la función de individuación o enumeración no es inferible, con la precisión deseable, a partir del resto de unidades lingüísticas. En español, a diferencia de lo que ocurre en las lenguas con clasificadores, se da le efecto prototípico (vid. §2.1) que Langacker (1991) denomina lexicalización inicial: ante la posible alternancia individual/masa, los nombres designan por defecto uno de dichos tipos. Palabras como 'pájaro', 'nube', 'berbiquí', etc. son interpretados en general y a menos que contextos muy marcados indiquen lo contrario, como entidades individuales. Por ello en muchos casos, el español no precisa de clasificadores que individúen, puesto que los lexemas de tipo 'individual' (sintácticamente 'contables'), por así decirlo, incorporan en su significado un clasificador genérico.

    Por otra parte, aún en casos en que se usen nombres que no designen entidades individuadas (nombres de masa, sustancia, etc.), la coaparición de los mismos junto a los determinantes y numerales propios de los nombres contables conlleva su interpretación por defecto como entidades individualizadas -casos de 'un café', 'dos inteligencias privilegiadas', etc.-. Nuevamente ello hace innecesaria en muchos casos la función individuadora de (el equivalente a) los clasificadores. Solamente en los casos en que ni la interpretación por defecto ni la individuación de masas por determinación son deseables o aplicables, el español utilizará construcciones con nombres partitivos -o nombres partitivos en función anafórico-pronominal- para referirse a entidades individualizadas.

    Desde otra perspectiva, adoptando el punto de vista de los hablantes de lenguas con clasificadores, este hecho puede ser visto de la siguiente manera:

    • en general, un sintagma nominal cuantificado en español, si no se construye con (el equivalente a) un clasificador (un nombre partitivo), debe interpretarse como si contuviera el clasificador genérico 'entidad individual'.

    Por otra parte, la ambigüedad clase/dosis (o alternancia masa/contable) en frases como 'tres vinos', en dónde un nombre habitualmente tratado como incuantificable aparece cuantificado -y puede ser interpretado según el contexto bien como [tres clases de vino] o bien como [tres vasos de vino]-, puede ser registrada como si en una de las interpretaciones apareciera un clasificador clasal -con significado [tipo] o [clase]-, y en la otra un clasificador genérico, o mensural -con significado [dosis]-. En las lenguas que disponen de tales clasificadores, tal ambigüedad no existe.

    La correspondencia de partitivos y análogos con los clasificadores es apuntada, como se ha dicho, por Lyons (1977), para quién palabras como 'cabeza', 'hoja' o 'pedazo' en 'una cabeza de ganado', 'dos hojas de papel' o 'un pedazo de hierro', "ejercen exactamente la misma función -de individuación y enumeración- que los clasificadores en tzeltal, chino, birmano, etc." Desde este punto de vista, palabras como 'grupo' corresponden a clasificadores colectivizadores; otras como 'trozo' realizan únicamente la función básica del clasificador, la de individuación; otras como 'lingote' o 'lámina' realizan además la de los que Lyons denomina clasificadores clasales: indicar el tipo de objeto (en estos casos según su forma); otras como 'vaso' o 'trago' la de los clasificadores mensurales: indicar cantidad o dosis convencional; y otras como 'terrón' función mixta, mensural y clasal ([tipo de entidad/forma] y [cantidad] ).

    Asimismo, como hemos dicho anteriormente, los clasificadores pueden tener función anafórica o pronominal; es decir, en ausencia del nombre referencial, nombrado anteriormente o sobreentendido, refieren al mismo. El paralelismo con los partitivos españoles es inmediato: ni 'plato' -en el sentido de [dosis] , no en el de objeto- ni 'rebanada' son directamente referenciales, pues un 'plato' puede ser de sopa, de lentejas o de lenguado a la meunière; y una 'rebanada', de pan, de corcho, o de cualquier otra entidad susceptible de ser cortada en trozos más o menos planos. Pero sí pueden ser utilizados con función referencial indirecta, o anafórico-pronominal, como en (42):

    (42)
    a. Me encantó tu sopa. Pónme otro plato.
    b. Adoro el pan. Pásame otra rebanada.

    Vistos pues los claros paralelismos entre ambos tipos de unidad léxica, examinemos de forma más precisa en la tabla V.1, apoyándonos en la tipología de Allan (1977), la correspondencia de diversos tipos de clasificadores con los nombres partitivos del español.

    Como se ha dicho, en principio, los grupos partitivos individuan una entidad y definen para la misma una relación merológica respecto a un todo de referencia, especificando una cantidad del mismo; pero además, describen otro tipo de propiedades formales de la entidad designada.

    La tabla V.1 clasifica de forma exhaustiva de qué tipo son dichas propiedades formales, resultando incluso sorprendentede qué modo los clasificadores en lenguas africanas, asiáticas y precolombinas, y los partitivos en castellano (y por extensión, muy probablemente, las lenguas indoeuropeas) codifican un mismo tipo común de información semántica. En consecuencia, la anterior clasificación será susceptible de servir de pauta para la codificación formal de dicho aspecto de la semántica de los partitivos en español.
 

tipo de clasificador (Allan, 1977)     equivalente en español     ejemplos
    partes del cuerpo     miembro     los miembros del calamar
    comida     plato, ración     una ración de calamares
    objetos puntiagudos     punta     la punta de la lengua
    forma alargada     barra, tira, cinta, lingote     una barra de madera
    forma plana     hoja, lámina, plancha     una plancha de hierro
    forma redonda     bola     una bola de sebo
    forma alargada+flexible     cinta, brizna     una cinta de seda
    forma alargada+rígida     barra, listón     una barra de hierro
    forma plana+flexible     hoja     una hoja de papel
    forma plana+rígida     plancha, tablón     un tablón de madera
    forma curvada     montón     un montón de hojas secas
    contenedores     vaso, botella, plato     un plato de lentejas
    forma anular     anillo     un anillo de bailarines
    masas informes     zurullo     un zurullo de barro
    tamaño grande     mole     una mole de piedra
    tamaño pequeño     grano, pizca     una pizca de azafrán
    lugar     parcela, bancal     una parcela de regadío
    disposición     rollo, ovillo     un ovillo de lana
    posición específica     reata, columna, fila     una columna de soldados
    volúmenes     puñado, bocado, cesto     un puñado de arroz
    instancia     tipo, clase, especie     un tipo de fruta
    partitivos     unidad, cabeza, miembro     una cabeza de ganado
    medidas- genérico     metro, kilo, litro     un metro de tela
    medidas- antropomórfico     puñado, palmo, pie, bocado     un palmo de terreno
    genéricos     trozo, cacho, fragmento     un trozo de pan
    disposición no inherente /colecciones     rebaño, racimo, grupo, par, manada, enjambre     un enjambre de abejas, un par de limones

Tabla V.1: Equivalencia entre clasificadores y partitivos

    Tras haber presentado la aproximación funcionalista a la descripción de los nombres partitivos y haber analizado su similitud con los clasificadores, en la sección siguiente propondré las que a mi juicio son sus propiedades generales.

5.2 Propiedades generales de los nombres
y grupos partitivos


5.2.1 Aspectos sintácticos
5.2.2 Descripción semántica
5.2.3 Clasificación de los nombres partitivos


    Un aspecto muy importante a tener en cuenta respecto a las construcciones partitivas es que la posición del nombre partitivo puede ser ocupada tanto por típicos partitivos (como los de la tabla V.1) como por nombres comunes en función partitiva.

    En el segundo caso, el proceso está sujeto de forma extraordinaria a la creatividad lingüística, en forma de extensiones de significado fundamentalmente metafóricas, como en los ejemplos de (43):

    (43)
    a. Una cinta interminable de casas unifamiliares de tres habitaciones
    b. Un laberinto de calles y callejuelas
    c. Una lágrima de vino
    d. Un alud de reclamaciones
    e. Una lluvia de insultos
    f. Una montaña de documentos

    La creatividad en el ámbito de las construcciones partitivas se desarrolla en dos sentidos relacionados: el ejemplificado en (43) -extensión metafórica de significado- y el de los ejemplos de (44), en donde se utiliza un partitivo en combinación con nombres para los cuales en principio el mismo no es adecuado:

    (44)
    a. Una gota de ironía
    b. Una tonelada de emociones fuertes
    c. Un puñado de héroes

    Nótese que, (44a) la ironía no es un líquido, por lo que no debería ser descomponible en gotas; (44b) las emociones no pesan (en el sentido físico), por lo que no podrían ser cuantificadas mediante medidas como 'tonelada'; y (44c) los héroes, siendo personas, tienen un tamaño que los hace no ser susceptibles de ser agarrados a puñados.

    Así, podemos considerar que la creatividad lingüística en las construcciones partitivas se realiza en dos tipos de extensiones de significado de tipo metafórico:

    • Adecuación de nombres comunes a un uso partitivo
    • Violación de las restricciones selectivas de los partitivos

    pudiéndose sin duda dar casos en que se utilizan simultáneamente ambos recursos, como en (45):

    (45) Una ensalada de tiros

    La naturaleza de tales extensiones metafóricas recae, como en toda metáfora, en la similitud imputada entre dos conceptos a partir de alguna característica o propiedad común, en dos sentidos:

    • En la adecuación de nombres comunes al uso partitivo, una propiedad muy relevante del nombre común se utiliza como elemento clasificatorio -p.e. (43a,b): forma o disposición estática de 'cintas', 'laberintos'; (43c,f): tamaño o magnitud (mínimas) de 'lágrimas' y 'pensamientos'; (43d,e): magnitud y disposición dinámica de 'lluvia' y 'alud'.

    • En la violación de restricciones selectivas del partitivo se trata el nombre de referencia (nombre del todo) como perteneciente -a causa de algunas de sus propiedades- a una clase a la que en realidad no pertenece -p.e. en (44a) 'ironía' es vista como un fluido y 'emociones' como un sólido (con capacidad de pesar)-.

    Éstos y otros ejemplos llevan a concluir que existen en principio dos tipos de partitivos en español:

    • partitivos puros (no utilizables como nombres comunes, como 'trozo', 'fragmento', etc.)
    • nombres comunes usados como partitivos por extensión de significado (utilizables con fuerza referencial propia).

    Un caso especial de indefinición es el de los nombres que son sistemáticamente polisémicos entre nombres comunes y partitivos, como es el caso de los contenedores, un caso de polisemia lógica será tratado de modo específico en el siguiente capítulo, y que podemos notar a partir de los ejemplos de (46).

    (46)
    a. Se ha roto el vaso
    b. Se ha bebido un vaso de agua

    Otro factor a tener en cuenta es que la distinción entre nombres comunes y partitivos no es a menudo clara y definida, sino que sucede a lo largo de una gradación entre ambos tipos que hace en muchos casos difícil de distinguir si un nombre pertenece a uno u otro tipo. Piénsese en casos como 'jirón', 'mendrugo', 'jauría', 'piara', 'brizna', 'filete', 'rebanada', 'ristra' o 'racimo'.

    Este tipo de indefinición está en relación directa con el fenómeno de las restricciones selectivas. Los partitivos, como los verbos y los adjetivos, son unidades predicativas, por lo que están sujetos a una restricción sobre el tipo de nominales con los que puede combinar. En los casos del párrafo anterior los partitivos se han especializado enormemente en la combinación con un tipo muy preciso de nombres: 'jirón' con 'ropa', 'mendrugo' y 'rebanada' con 'pan', 'jauría' con cánidos, 'piara' con 'cerdos', 'brizna' con 'hierba', 'filete' con carne comestible, 'ristra' con 'ajos' y 'racimo' con 'uva'.

    En algunos casos ('jirón', 'mendrugo') la restricción parece circunscribirse únicamente al tipo específico citado (ropa, pan). En otros parece que la restricción designa un tipo preferente, aunque no exclusivo: 'rebanada' suele asociarse con pan y 'filete' con ternera, aunque puede hablarse rebanadas de corcho, filetes de cerdo o merluza, etc.; como también de piaras de mulas o de jaurías de lobos o de nazis.

    El grado de especialización en las restricciones selectivas de los partitivos es interpretable en términos de grado de lexicalización o de tendencia a ser utilizados como nombre común -referencial por sí mismo sin necesidad de hacer más explícito el tipo de entidad-. Dicha gradación es modelizable formalmente en forma de preferencias, o bien mediante de valores por defecto. En el primero de los modelos se atribuyen a los valores posibles pesos estadísticos de acuerdo con su frecuencia de realización. En el segundo, uno de los valores, el más frecuente o habitual, es privilegiado en la representación mediante la atribución del status de valor por defecto. De ese modo, dependiendo del sistema utilizado, se diría que, por ejemplo, un nombre como 'ristra' referirá por defecto, o en un 90% de los casos a [ajos] . En consecuencia si 'ristra' aparece en el discurso de forma que no pueda inferirse referencia a un tipo concreto de entidad, será interpretado preferentemente o por defecto como con referencia a [ajos] . En este trabajo no manejaré modelos estadísticos de representación del conocimiento léxico, por lo que el aspecto del problema descrito en los párrafos anteriores no será abordado.

    Por otra parte, este fenómeno puede ser relacionado con el expuesto anteriormente de adecuación de nombres comunes a una función partitiva, en el sentido de que resultan ser procesos mutuamente inversos. En un caso se da una semantización de un partitivo, que conlleva la posibilidad de su utilización como nombre común (o plenamente referencial); p.e., 'andrajo' como referente a 'vestido' o 'ropa' sin ulterior complemento que lo especifique. En el otro caso sucede una desemantización de un nombre, conllevando su utilización como partitivo: p.e. 'lluvia' pierde su cualidad de precipitación meteorológica de agua para conservar únicamente el significado de precipitación (de cualquier otra cosa).

    A continuación describiré las que son a mi juicio las características principales de los grupos partitivos y de los nombres que actúan dentro de ellas en función de partitivo, obviando en dicha descripción el hecho de que sean partitivos puros, nombres comunes reclasificados, o nombres sistemáticamente polisémicos entre ambos.
 
 

5.2.1 Aspectos sintácticos

    Antes de entrar en el núcleo de la descripción, puramente semántica, resulta adecuado comentar aunque sea brevemente la sintaxis de los grupos partitivos.

    La apreciación fundamental, y obvia, respecto a los nombres partitivos, es que son, morfosintácticamente, nombres. Palabras como 'trozo' o 'rebanada' tienen flexión de género y número, concuerdan en género y número con los determinantes con los que combinan ('un trozo', 'las rebanadas'), admiten adjetivos que deben concordar en los mismos términos ('un trozo grande', 'dos magníficas rebanadas') y son susceptibles de aparecer en las mismas posiciones estructurales que cualquier nombre. Además, naturalmente, en las construcciones partitivas ('una copa de champán', 'un trozo de naranja') son el núcleo sintáctico del sintagma -ver fig. V.2-.
 


Fig. V.2: El nombre partitivo como núcleo sintáctico
del grupo partitivo
 

    Sin embargo, en los primeros tiempos del generativismo (cf. Langacker 1991) se propuso desgajar la preposición 'de' del nombre que le sucede, formando un análisis del tipo [ADJUNTO 'un trozo de' [SN 'naranja]] -ver fig. V.3-.
 


Fig. V.3: Grupo art+partitivo+'de' como
adjunto del núcleo semántico
 

    Dicho análisis venía sugerido por la evidencia semántica de que el nombre normalmente analizado como complemento, el nombre del 'todo', parece ser el núcleo semántico del grupo. De modo más preciso, el paralelismo de frases cuantificadas como (47a,b,c) con frases partitivas como (47d), llevaron a considerar el grupo artículo+partitivo+'de' como un cuantificador del nombre (ver fig. V.4). El análisis es debido a que desde un punto de vista semántico los complementos verbales de las frases como las de (47) pueden ser interpretados como la cantidad de naranja o naranjas a ser comidas por el agente -tres, muchas, una partición exacta: media, o una partición de medida indeterminada-.

    (47)
    a. Me comeré tres naranjas
    b. Comeré muchas naranjas
    c. Me comeré media naranja
    d. Me comeré un trozo de naranja


Fig. V.4: Grupo art+partitivo+'de' como
cuantificador del nombre

    Sin embargo al análisis de la fig.V.4 fue pronto rechazado, dada lo antinatural de desgajar una preposición de su evidente complemento para colocarla en la posición final de otro constituyente. Así, Chomsky (1981, cf. Hernanz y Brucart, 1987), propuso considerar la preposición en este tipo de sintagmas como un mero expletivo, un marcador de caso sin contenido semántico, aproximadamente como en Fig. V.5:
 


Fig. V.5: Preposición como expletivo marcador de caso
 

    Al menos en el caso de las lenguas románicas, dicho análisis parece que debe ser confirmado. En castellano (y catalán, francés, etc.) la preposición 'de' es la marca de genitivo; y en latín, una de las funciones del caso genitivo era, como indica Valentí (1974), la de Genitivo Partitivo, es decir, indicar

    "el todo del que se toma una parte. Se encuentra (...) con sustantivos indicando masa, cantidad o medida: 'acervus pecuniae' (montón de dinero). 'modius tritici' (un modio de trigo)".

Valentí, E. (op. cit.)

    No debe extrañarnos pues que, si en latín clasificadores de colectivización o medida como 'acervus' o 'modius' tenían trato morfológico de sustantivos, y los sustantivos que referían al todo estaban en genitivo, en las lenguas romances se mantengan dichos rasgos (por lo que respecta al genitivo sustituyendo la flexión declinativa por la anteposición de la preposición 'de').

    Otro hecho que parece confirmar el análisis de vacuidad semántica de la preposición 'de' en los grupos partitivos es la posibilidad de elisión, habitual ciertos registros coloquiales, de dicha preposición en frases como (48a); algo que, por otra parte, no es posible en el caso de preposiciones con contenido semántico como la de (48b).

    (48)
    a. Un vaso vino (por 'Un vaso de vino')
    b. *Vengo Barcelona (por 'Vengo de Barcelona')

    A mi juicio los problemas de indefinición en la descripción sintáctica de los grupos partitivos tiene su origen en una concepción radicalmente composicionalista del lenguaje. En concreto, en la asunción de un total isomorfismo entre sintaxis y semántica. Tal postura conduce en el caso de los grupos partitivos a una inevitable contradicción entre análisis sintácticos y semánticos naturales: mientras resulta obvio que el partitivo es, sintácticamente, el núcleo del sintagma, semánticamente el análisis natural es el inverso .

    En mi propuesta de representación (ver capítulo siguiente) ambos hechos no son contradictorios. El marco de composición sintagmática que aplicaré, basado en la noción de co-composición desarrollado por Pustejovsky (1995), permite la integración de la información semántica contenida en el partitivo y en su complemento de modo no estrictamente dependiente de la configuración superficial (sintáctica) del grupo.

    Así, como veremos, en un nivel la aglutinación de los lexemas en un grupo se producirá siguiendo las pautas sintácticas habituales, es decir, tratando al partitivo como núcleo y al grupo preposicional ('de' + nombre referencial) como complemento. Sin embargo, los mecanismos de composición semántica forzados por la cualidad de partitivo del núcleo sintáctico, por una parte no tomarán en consideración alguna desde el punto de vista semántico a la preposición -luego ésta no aportará contenido semántico alguno al grupo construido-; y por otra parte, tomarán de cada nombre, el partitivo y el referencial, la información semántica relevante para la construcción del significado global del grupo, de modo que ni el partitivo ni el nombre del 'todo' recibirán un tratamiento específico de núcleos semánticos, sino que ambos contribuirán de forma equilibrada al significado global de la construcción.
 
 

5.2.2 Descripción semántica

    Los nombres partitivos pueden clasificarse en distintos tipos de acuerdo con la función que realizan. A primera vista podemos distinguir entre dos tipos principales: agrupadores (como 'grupo', 'equipo' o 'jauría'), y extractores (porciones de masas, elementos de colecciones). Un tercer tipo a tomar en consideración es el de los nombres que denotan zonas límite de entidades, como 'extremo', 'punta' o 'superficie'. Una clasificación de los partitivos de acuerdo con los distintos tipos de términos con los que pueden combinar se desarrollará en la siguiente sección. Sin embargo, los nombres partitivos comparten en general ciertas de características comunes:

    • Los partitivos son nombres que no pueden ser referenciales por sí mismos, aislados. Necesitan de un complemento para construir de modo completo la referencia a una entidad. En consecuencia, los partitivos son lógicamente relacionales.

    • Una construcción partitiva (p.e., 'taza de café') siempre denota una entidad individual, incluso en el caso de que la frase nominal que funciona como complemento (en el caso del ejemplo, 'café') denote una masa o sustancia. En consecuencia, la composición de partitivos con frases nominales complemento es un mecanismo de individuación.

    • Además, habitualmente, los partitivos tienen una función semántica múltiple. Por una parte todos ellos son cuantificadores relativos de su complemento nominal, dado que especifican una cantidad en relación a la entidad de referencia (cf. Langacker, 1991). Por otra parte, la mayoría de ellos se comportan como adjetivos en el sentido de que predican diferentes tipos de propiedades de la entidad de referencia, p.e. forma ('barra', 'hoja'), modo de obtención ('rebanada'), estructura ('grano'), etc.

    • Los partitivos actúan como functores que toman como argumento la entidad denotada por el complemento nominal. En consecuencia los partitivos están sujetos a restricciones de selección.

    • Típicamente, los partitivos seleccionan complementos de tipo cumulativos: masas o plurales (que son también cumulaciones, en este caso cumulaciones de entidades individuales). Sin embargo, se dan también casos, como en (49), en que el complemento es, al menos aparentemente, no una entidad cumulativa sino una entidad individual. En los casos de ese tipo, la entidad individual, habitualmente (49a,b) -pero no siempre, (49c)- muestra los rasgos gramaticales de los nombres de masa (es decir, ausencia de determinante). Este hecho sugiere que posiblemente intervenga en el proceso algún tipo de efecto de reclasificación de la entidad individual en entidad masiva o cumulativa.
 

    (49)
    a. un trozo de silla
    b. una rodaja de tomate
    c. un capítulo del libro

    • A pesar de ser el núcleo sintáctico de las construcciones partitivas, los nombres partitivos no parecen en muchos aspectos ser el núcleo semántico de los mismos. Por ejemplo en un caso como (50), dado que 'beber' selecciona argumentos de tipo líquido, necesariamente 'taza de café' debe pertenecer al tipo líquido-y no, por ejemplo, al tipo contenedor-.
 

    (50) Se bebió una taza de café

    Una representación formal de los nombres partitivos para el procesamiento del lenguaje debe dar cuenta de las propiedades relacionadas en esta sección; ello es lo que llevaremos a cabo en el siguiente capítulo.
 
 

5.2.3 Clasificación de los nombres partitivos

    Básicamente, podemos clasificar los nombres partitivos desde dos puntos de vista. En primer lugar pueden clasificarse de acuerdo con las propiedades (en su mayor parte propiedades formales: magnitud, forma, cantidad, etc.) que aportará la semántica del partitivo al grupo sintagma. En otras palabras, de acuerdo con las propiedades del concepto resultante de la composición que dependen del significado del nombre partitivo. En segundo lugar, los nombres partitivos pueden clasificarse de acuerdo con el tipo de concepto léxico o entidad con el que pueden combinar; es decir, de acuerdo con las restricciones de selección del nombre partitivo.

    Ambos modos de clasificación son complementarios e intersectarán entre sí. P.e., suponiendo un tipo de partitivos definido del segundo modo por combinar con nombres de masas sólidas ('tira', 'lingote', 'lámina', 'fragmento'), algunos de ellos son clasificables de acuerdo con el primer modo por denotar forma alargada ('tira', 'lingote'), otros por denotar forma plana ('lámina'), y otros por no denotar forma ('fragmento').

    El primer tipo de clasificación corresponderá en las representaciones de LKB (ver §3.3, y más adelante §6.1) a la atribución de distintos tipos de valores en la estructura de qualia, especialmente correspondientes al Rol FORMAL. El segundo a definición en la Estructura Argumental del tipo del argumento correspondiente al complemento seleccionado por el partitivo.

    Las especificaciones correspondientes a la clasificación por propiedades formales son desarrollables tomando como base la tipificación que he realizado en la tabla V.1 de §5.1 a partir de los clasificadores de diversas lenguas descritos por Allan (1977), los cuales resultarán en diferentes valores para descriptores de la Qualia (forma, magnitud, disposición, ...).

    Aunque este modo de clasificar los partitivos resulta altamente informativo en cuanto a la representación del conocimiento general asociado a las unidades léxicas, una clasificación atendiendo a las restricciones de selección parece ser más relevante desde el punto de vista del procesamiento gramatical, pues será la base para la resolución de anáforas, elipsis y de la ambigüedad semántica en general y, en definitiva, para la descripción de la combinatoria de los signos necesaria en cualquier sistema de procesamiento del lenguaje. La realización de este segundo tipo de clasificación, sin embargo, es una tarea más compleja dada la dificultad de establecer generalizaciones al respecto, como puede verse a partir de las dificultades halladas por Bond et al. (1996) para poner en relación las restricciones selectivas de los partitivos ingleses con las construcciones del japonés en un sistema de traducción automática, de la heterogeneidad de la descripción de la combinatoria realizada por Sinclair ed. (1990), o de las argumentaciones relativas al ejemplo (103) que desarrollaré en §6.2 y al ejemplo (113) en §7.1.

    Las aproximaciones de Bond et al. y de Sinclair se basan fundamentalmente en el aspecto sintáctico de la contabilidad o no contabilidad del complemento, sin embargo, (ver §6.2 y §7.1) es patente la necesidad de tener en cuenta factores semánticos, como el tipo de entidad (individuales, sustancias, grupos) o el modo de referencia (referencia a entidades discretas o a clases genéricas de de entidades), o gramaticales de otro tipo, como el número (selección de nombres en singular o en plural).

    Los partitivos derivados de nombres de contendores, por ejemplo, parecen poder seleccionar sustancias (51a), plurales de individuales (51b) y plurales de clases (51c).

    (51)
    a. una caja de arroz
    b. una caja de lentejas
    c. una caja de vinos

    Con el fin de efectuar una clasificación homogénea de los tipos de partitivos de acuerdo con sus restricciones selectivas es preciso en mi opinión desarrollar previamente un marco de representación que permita detectar las regularidades semánticas que subyacen a dichos tipos diversos de conceptos léxicos. Dicho trabajo lo realizaré en §7, por lo que pospondremos de momento la clasificación de los nombres partitivos de acuerdo con sus restricciones selectivas hasta el final de dicho capítulo.

5.3 Conclusiones


    En este capítulo he examinado las características básicas de los nombres partitivos, afirmando en primer lugar que los mismos construyen a partir de la combinación con el complemento un concepto sintagmático denotador de un nuevo tipo de entidad distinto del de la entidad de origen (denotada por el complemento), estableciéndose entre ambas una relación merológica representable mediante los mismos tipos de relación utilizada para la descripción de las relaciones parte-todo entre conceptos léxicos.

    Se han descrito asimismo los paralelismos existentes entre los nombres partitivos de lenguas como el español y los clasificadores de otros tipos de lenguas, de modo que una tipificación de estos últimos, realizada a partir del trabajo de Allan (1977) sobre clasificadores, permite clasificar los partitivos de acuerdo con las propiedades formales del objeto denotado.

    He analizado asimismo las propiedades sintácticas y semánticas de los partitivos del español, destacando de entre estas últimas la distinción entre partitivos puros y nombres comunes usados como partitivos, su naturaleza relacional en cuanto a predicados, su función primordial como mecanismo de individuación y sus funciones derivadas como cuantificadores relativos y como predicadores de propiedades (básicamente formales) al estilo de los adjetivos.

    Finalmente, se ha abordado el problema de la descripción de las restricciones selectivas de los partitivos, concluyendo que para estructurarlas de modo homogéneo en un sistema de procesamiento del lenguaje es preciso desarrollar un marco de representación de los tipos de entidades y de los modos de referencia a las mismas, trabajo que se describirá en §7.

    En el capítulo siguiente procederé a establecer las bases para la formalización de las propiedades semánticas de los partitivos, en el marco de la teoría desarrollada por Pustejovsky, implementable en un sistema de representación del lenguaje mediante estructuras de rasgos, en nuestro caso LKB.

6. Representación formal del significado de los partitivos


6.1 Marco teórico: el Lexicón Generativo
6.2 Formalización de la semántica de los partitivos en el marco del Lexicón Generativo
6.3 Conclusiones


    En este capítulo abordaré la representación formal de los nombres partitivos puros, así como la de los nombres sistemáticamente polisémicos entre nombre referencial y partitivo -tomando para ello como ejemplo paradigmático el caso de los nombres de contenedores-. Respecto a estos últimos, asumiré siguiendo los postulados de Pustejovsky (1991,1995) que un objetivo deseable de la representación del significado léxico es el de dar cuenta de la polisemia lógica de modo que se evite la enumeración de múltiples sentidos relacionados de una misma palabra. Para ello, será interesante postular entradas léxicas infraespecificadas que, por una parte subsuman los posibles sentidos que una palabra puede adquirir en contexto y, por otra, den cuenta de la relación sistemática que existe entre los mismos.

    Me centraré en éste y en el siguiente capítulo en los partitivos puros y en su combinación con nombres denotadores de entidades físicas. El caso de los nombres comunes reclasificados como partitivos y el de la combinación de partitivos con entidades abstractas -como en los casos de (52)- no lo abordaré pues precisa de un tratamiento más amplio que incluya la modelización de la metáfora.

    (52)
    a. el final de la película
    b. un puñado de buenas ideas
    c. una gota de ironía
    d. la base de su argumentación

    El tipo de construcciones partitivas de las que (52) son ejemplo deben enmarcarse en el fenómeno más amplio, de uso general en el lenguaje, descrito por Lakoff y Johnson (1980), de conceptualización de entidades abstractas en términos de entidades concretas. En otras palabras, el problema no es abordable simplemente basándose en la selección de tipos de entidades abstractas por parte de tipos de nombres partitivos, sino que debe afrontarse a partir de la conceptualización de términos abstractos por analogía con términos físicos, por ejemplo por analogía con términos espaciales. En los casos de (52), por ejemplo, de la conceptualización de una película (52a) como una línea orientada; de los constructos mentales -[ideas] en (52b)- en términos de sólidos tangibles, que por lo tanto pueden ser agarrados; de la ironía (52c) como un fluido, o un líquido que puede destilar de los discursos; o de los argumentos (52d) como extensión metafórica de una construcción o edificio, con sus cimientos, base, solidez, consistencia, etc.

    Esta interesante problemática escapa a los objetivos de este trabajo: el análisis, la descripción y la formalización de los mecanismos generales de formación y uso de los sintagmas partitivos. Se trata pues de un tema abierto que puede constituir una línea futura de trabajo.

    El presente trabajo de representación, que se enmarca en los presupuestos lingüístico-formales de Pustejovsky, es representable, como se ha dicho (ver §3.3), mediante estructuras de LRL-LKB. Los dos tipos de estructuras deben ser vistos como dos niveles distintos, dispuestos de modo secuencial, en el proceso de formalización del conocimiento lingüístico. Las representaciones al estilo de Pustejovsky son de orden más abstracto (de más alto nivel) que las de LRL-LKB; estas últimas son una implementación de las primeras ya directamente interpretable por el entorno computacional. En este capítulo trataré el problema a la luz de la teoría del Lexicón Generativo de Pustejovsky, y en el siguiente desarrollaré la propuesta en términos de estructuras del lenguaje de representación del conocimiento LRL-LKB -aunque debidamente simplificadas para adecuarme a las necesidades de la exposición-.

    A continuación, describiré en primer lugar las líneas maestras de la teoría de Pustejovsky (§6.1), para pasar a continuación en §6.2 a describir mi propuesta de formalización.

6.1 Marco teórico: el Lexicón Generativo


    El trabajo de Pustejovsky, la Teoría de Qualia y el Lexicón Generativo, parte de la consideración del léxico no como un componente estático y enumerativo del sistema lingüístico sino como repositorio fundamental de gran parte de la potencialidad significativa y creativa del lenguaje. El objetivo básico de su propuesta es dar cuenta de diversos aspectos del lenguaje natural no cubiertos hasta el momento o cubiertos de forma insuficiente por la semántica compositiva, fundamentalmente el problema central de la polisemia de las unidades léxicas: cómo es que somos capaces de atribuir un número potencialmente infinito de sentidos a las palabras en contexto, con un número limitado de recursos. Es en este sentido que su marco teórico se denomina 'El Lexicón Generativo'.

    A tal efecto, el autor desarrolla un innovador marco de representación formal y computacional, capaz de dar cuenta, entre otros, del conocimiento léxico asociado a diversos fenómenos de individuación y de relación Parte-Todo. En esta sección se presentan los fundamentos del Lexicón Generativo, y en especial su aplicación al tratamiento de acciones, procesos y estados. En este enfoque, dichas relaciones temporales son tratadas como unidades compuestas de sub-eventos, de modo que se establece una relación Parte-Todo entre los elementos léxicos que las denotan.

    En el trabajo de Pustejovsky (1991,1995), verbos, nombres y adjetivos no son considerados como predicados simples sino como constructos infraespecificados que contienen una estructura lógica compleja capaz de dar lugar a múltiples interpretaciones dependiendo del contexto lingüístico en que éstos se vean inmersos. Con ello se persigue minimizar la postulación de entradas diferentes en el lexicón para dar cuenta de significados distintos pero relacionados de una misma palabra. En el marco del Lexicón Generativo se sustituye la visión, habitual en los sistemas formales y computacionales, del lexicón como un listado enumerativo de entradas -una para cada sentido de cada palabra- por una representación basada en entradas léxicas capaces de tomar, dependiendo del contexto oracional, uno de entre una multiplicidad de sentidos interrelacionados. De este modo, el lexicón pasa a constituirse en un elemento, no consultivo y estático, sino central y activo -generativo-, de los sistemas formales de descripción lingüística.

    La noción básica sobre la que se erige el formalismo del autor, la infraespecificación, es definida como la capacidad de los signos de intervenir en diferentes estructuras sintácticas y en consecuencia en distintas operaciones de composición semántica. Así, la infraespecificación aparece tanto como un método de tratamiento de la polisemia, como una manera de dar cuenta de modo formal y predictible de la relación sistemática entre diferentes sentidos de una misma palabra.
 

    Niveles de Representación

    En la propuesta de Pustejovsky un signo léxico de cualquier tipo está estructurado en cuatro niveles: Estructura Argumental, Estructura de Eventos, Estructura de Herencia Léxica y Estructura de Qualia; y esta última en cuatro Roles: FORMAL, AGENTIVO, CONSTITUTIVO y TÉLICO -vid. (53)-. Esta organización (representable en formalismos basados en matrices de rasgos, pero en sí independiente de formalismo alguno) no debe ser vista como un listado de propiedades interesantes de las palabras, sino como una estructura de propiedades lógicas de los signos; por así decirlo, como un conjunto de hitos a partir de los cuales proyectar una interpretación semántico-formal de las palabras en contexto.

    (53)

   [signo léxico
   ESTRUCTURA EVENTUAL
   ESTRUCTURA ARGUMENTAL
   ESTRUCTURA DE HERENCIA LÉXICA
   ESTRUCTURA DE QUALIA: [ROL FORMAL
                                                    ROL AGENTIVO
                                                    ROL TÉLICO
                                                    ROL CONSTITUTIVO]]

    La Estructura Argumental especifica el número y tipo de argumentos lógicos de una unidad léxica, y cómo se realizan éstos sintácticamente; en la Estructura Eventual se define el tipo correspondiente al aspecto verbal denotado (estado, proceso, etc.); en la Estructura de Herencia Léxica se especifica cómo una estructura léxica se relaciona con otras en la estructura de tipos en la que se organiza globalmente el lexicón; y en la Estructura de Qualia se relacionan los elementos de las estructuras Argumental y Eventual, representando los diferentes modos de predicación posibles de una unidad léxica. Los valores de los roles de la Estructura de Qualia no son propiedades de los referentes, sino predicados lógicos, en los que el functor viene determinado en parte por la cualidad predicativa de la unidad léxica y los argumentos son Eventos y/o Argumentos. En todo caso, los valores de los rasgos representados en la entrada léxica (argumentos, eventos, estructuras, roles) tienen atribuidos tipos de una estructura jerárquica subyacente que define el modelo del mundo y del conocimiento lingüístico con el que se trabaja.

    Un ejemplo simple de representación a partir de estas premisas sería el de 'dormir' en (54), representado como un predicado definido aspectualmente como un proceso y que toma un único argumento: un ser animado; en el Rol Formal de la Estructura de Qualia (en lo sucesivo Qualia) se relacionan las estructuras Argumental y Eventual, dando lugar a la forma de predicación que se atribuirá al signo en su interpretación lógico-semántica.

    (54)
    [dormir
    EVENTSTR: e = proceso
    ARGSTR: x = entidad_animada
    QUALIA: FORMAL: dormir(e,x)]


    La Estructura Eventual

    En las aproximaciones que han devenido habituales en la formalización lógica del aspecto y la 'Aktionsart' (cf. Davidson, 1967; Parsons, 1990) los eventos se representan como una variable (o argumento) del predicado -como por ejemplo (55b) o (55c), como representación de (55a)-, correspondiendo a cada predicado verbal un tipo de evento según una clasificación de modos de acción, de la que el ejemplo más clásico sería (56).

    (55)
    a. Edelmiro corre
    b. [e] corre(e,Edelmiro)
    c. [e] corre(e) & AGENTE(e,Edelmiro)

    (56)
    a. Estados: saber, permanecer, estar enfermo
    b. Actividades: caminar, leer, escribir
    c. Realizaciones: erigir, construir
    d. Logros: encontrar, reconocer, alcanzar

    De forma intuitiva las diferencias entre dichas clases consisten en que, por una parte, Estados y Actividades -a diferencia de Realizaciones y Logros- no tienen delimitación temporal precisa, distinguiéndose entre sí en que mientras que en los primeros el sujeto del evento es experimentador del mismo, en los segundos éste juega un papel activo (o agentivo); y diferenciándose Realizaciones de Logros en que mientras los segundos son eventos temporalmente puntuales, las primeras constan de una actividad que resulta en una culminación de la misma, la cual delimita el evento en el tiempo y le confiere su carácter télico, de forma que hasta que ésta no se produce no puede denominarse a la Realización como tal.

    Yendo más allá de esta clasificación, Pustejovsky asume -siguiendo en parte a van Benthem (1983), Kamp (1979) y Grimshaw (1990)- la escisión de cada clase eventiva en pares de sub-eventos y -desarrollando los análisis de Talmy (1975, 1976)- una especificación de la prominencia relativa de los sub-eventos en términos de 'nuclearidad eventiva'. El autor parte para desarrollar su trabajo de:

    (a)- una clasificación de los eventos en Procesos, Estados y Transiciones entre los dos anteriores);

    (b)- tres relaciones de ordenación temporal entre sub-eventos: <# (precedencia), 0# (solapamiento), y <0# (solapamiento parcial);

    y (c)- la noción de 'núcleo' (marcado *), o sub-evento focal o más prominente en la estructura eventiva de un predicado.

    Así, una Realización como 'escribir' se representará como una transición entre un proceso (el de construcción) y un estado (existencia final de la obra escrita) como en (57a), de forma que, incorporando la noción de núcleo sub-eventivo, podrá distinguirse entre 'He escrito un libro' (57c) y 'Estoy escribiendo un libro' (57b); o en un caso de simultaneidad de eventos (o de un único evento que puede contemplarse desde dos puntos de vista), distinguir entre 'comprar' (57d) y 'vender' (57e).

    (57)
    a. [escribir]: e = eP <# eE
    b. [estoy escribiendo un libro]: e = eP* <# eE
    c. [he escrito un libro]: e = eP <# eE*
    d. [comprar]: e = e1* 0# e2
    e. [vender]: e = e1 0# e2*

    Este estado de cosas se representará en la matriz de rasgos correspondiente a la estructura eventiva como en (58) -representativa de la lectura típica de 'escribir' como proceso-, dando como valores de Ei los sub-eventos inherentes al predicado, e indicando en RESTR el tipo de ordenamiento temporal imperante y en HEAD el sub-evento nuclear:

    (58)
    [escribir
    EVENTSTR:     E1: e1 = proceso
                             E2: e2 = estado
                             RESTR: <#
                             HEAD: e1 ]


    Estructura Argumental

    La estructura argumental de Pustejovsky (1995) no prevé únicamente, como es norma habitual, la existencia de argumentos de realización obligatoria para un predicado, sino también la de argumentos de realización opcional -o 'Argumentos Defectivos' - y la de 'Argumentos Sobreentendidos'. Los Argumentos Defectivos (D-ARG) se definen como "parámetros que participan en las expresiones lógicas de la Qualia, pero que no necesariamente están expresados sintácticamente"; y los Argumentos Sobreentendidos (S-ARG) como "parámetros que están semánticamente incorporados a la unidad léxica y que tan sólo se expresan en especificaciones del discurso". La incorporación de ambos tipos de argumentos a la estructura de un signo léxico no responde únicamente a una intención de análisis exhaustivo de la connotación semántica de las palabras, sino que constituye uno de los ejes básicos en los que se sustenta la posibilidad de múltiple interpretación de las mismas, es decir, de la representación y captura de la polisemia. Así, una representación de los verbos del catalán 'amanir' ('aliñar') en (59a) y 'salar' ('sazonar') en (60a) permitirá, en el primer caso, construir las interpretaciones correspondientes a (59b) y (59c) -mediante la incorporación o no, determinada por el contexto, del Argumento Defectivo-; y en el segundo caso, interpretar (60b) y rechazar (60c), pero construir (60d).

    (59)
    a.
    [amanir
    ARGSTR: [A1: x = humano
                     A2: y = alimento
                     D-A: z = especias (= aceite, sal, ...)]]

    b. He amanit l'enciam  'He aliñado la lechuga'
    c. He amanit l'enciam amb oli i sal  'He aliñado la lechuga con aceite y sal'
 
 

    (60)
    a.
    [salar
    ARGSTR: [A1: x = humano
                     A2: y = alimento
                     S-A: z = sal]]

    b. He salat la carn  'He sazonado la carne'
    c. *He salat la carn amb sal    *'He salado la carne con sal'
    d. He salat la carn amb sal de Cardona   'He sazonado la carne con sal de Cardona'


    La Estructura de Qualia y los mecanismos de composición

    Como se ha indicado anteriormente, es en este nivel de representación en dónde se imbrican las estructuras Argumental y Eventiva, proporcionando un armazón estructural sobre el que aplicar mecanismos generativos, transformaciones semánticas, que alteren la denotación de un signo léxico en función del contexto en el que aparezcan. Los cuatro Roles que la constituyen se definen intuitivamente de la siguiente forma:

    • Rol Constitutivo: La relación entre una entidad y sus partes; y también la relación entre una entidad y aquella entidad compleja de la que es parte

    • Rol Formal: Aquello que distingue a la entidad en un dominio amplio. Valores posibles para objetos son Magnitud, Forma, Dimensionalidad, etc. Intuitivamente, este rol debe ser visto como un predicado estativo, "un estado que existe sin referencia a cómo se ha llegado a él"

    • Rol Télico: Función inherente o propósito de un agente al realizar una acción.

    • Rol Agentivo: Factores implicados en su origen o creación

    Un ejemplo del funcionamiento de la Estructura Qualia para nombres puede deducirse a partir de la representación de 'novela' en (61a), en dónde la adecuada selección (determinada por el contexto) de una de las predicaciones de las codificadas en los roles Télico o Agentivo permitirá de forma alternativa en la frase (61b) construir bien la interpretación (61c), bien la (61d).

    (61)
    a.
    [novela
    QUALIA: [FORMAL: libro(x)
                    TÉLICO: leer(e1,y,x)
                    AGENTIVO: escribir(e2,z,x)]]

    b. He empezado la novela
    c. He empezado [a leer] la novela
    d. He empezado [a escribir] la novela

    Un ejemplo para verbos es el que expondremos a continuación con la representación de 'hundir' en (62), a partir de la cual veremos el funcionamiento global de la estrategia de Pustejovsky para el tratamiento de la polisemia; en este caso concreto, en el tratamiento mediante una única entrada léxica infraespecificada de la alternancia causativo-inacusativa.

    (62)
   [hundir
   EVENSTR: [E1: e1 = proceso
                       E2: e2 = estado
                       RESTR: <#
                       HEAD:]
   ARGSTR: [ARG1: x
                    ARG2: y]
   QUALIA: [FORMAL: hundir_resultado(e2,y)
   AGENTIVO: hundir_acción(e1,x,y)]]

    Como puede verse, en (62) la relación entre el evento que es causa y el estado resultante está expresado por el hecho de la existencia en los roles de la Qualia de parámetros comunes a la Estructura Argumental y la Estructura Eventiva; por otra parte, la ambigüedad inherente a hundir entre la interpretación causativa (63a) y la inacusativa (63b) está representada por la no especificación del rasgo 'head' ('núcleo') de la Estructura Eventiva.

    (63)
    a. Los enemigos hundieron el barco
    b. Se hundió el barco

    La aplicación de los mecanismos de composición adecuados permite, a partir de la representación infraespecificada (62), representable mediante la forma lógica (64), la interpretación correspondiente a (63a) mediante la atribución de carácter nuclear al sub-evento e1 (vid. 65a), representable mediante la forma lógica (65b), en la que la interpretación prominente es la Agentiva -crucialmente, aquélla en que aparece como argumento la variable e1-, quedando la Formal 'oscurecida'; y en otro caso la correspondiente a (63b), declarando como núcleo e2 (vid. 65c, 65d), en la que se 'oscurece' la interpretación Agentiva y se destaca la Formal -pues es aquella en que e2 es argumento-.

    (64)
    [x,e1,y,e2] (AG = hundir_acción(e1,x,y) & FOR = hundir_resultado(e2,y))

    (65)
    a. [Los enemigos hundieron el barco] e = e1* <# e2
    b. [x,e1,y,e2] (AG* = hundir_acción(e1,x,y) & FOR = ...)
    c. [El barco se hundió] e = e1 <# e2*
    d. [x,e1,y,e2] (FOR* = hundir_resultado(e2,y) & AG = ...)

    El autor describe tres mecanismos generativos de combinación y selección de tipos: Ligamiento Selectivo (selective binding), Coerción de Tipos (type coertion) y Co-composición (co-composition). El primero es el que permite la dualidad de interpretaciones (causativa/inacusativa) en el ejemplo propuesto, así como en fenómenos similares, y sucede cuando una unidad léxica o un sintagma opera de forma específica en una subestructura de la representación sin alterar los tipos.

    La Coerción de Tipos sucede cuando una unidad rectora fuerza a otra a alterar su tipo semántico (pero no su tipo sintáctico), como en el caso de (61b) en dónde el verbo, 'empezar' selecciona semánticamente un evento en la posición de objeto y, dado que 'novela' es de tipo objeto, 'empezar' fuerza un cambio de tipo en 'novela', de objeto a evento, proporcionando una interpretación tal como las de (61d,c) -interpretaciones posibles a causa de que el Rol Télico de 'novela' es el predicado 'leer', y el Rol Agentivo 'escribir'-.

    Finalmente, la co-composición ocurre cuando múltiples elementos en un sintagma actúan como functores (no únicamente uno de ellos, p.e. el verbo, como es lo habitual), generando nuevos sentidos no lexicalizados para algunas de las palabras que intervienen en la composición. Este mecanismo hace posible que 'bake' ('cocinar en el horno') adquiera el sentido de CREACIÓN en 'bake the cake' ('hornear el pastel') por co-composición de 'bake' y 'cake', mecanismo que se desencadena a causa de la identidad de valores en uno de los roles de la qualia de ambos participantes en la composición -suponiendo para los del ejemplo representaciones como en (66)-.

    (66)
    a. [bake
       QUALIA = [AGENTIVO = bake_act] ]

    b. [cake
        QUALIA = [AGENTIVO = bake_act] ]
 

    Tipos complejos y Paradigmas Léxico-Conceptuales

    Otro interesante mecanismo de tratamiento de la polisemia introducido por Pustejovsky es el de los Paradigmas Léxico-Conceptuales (PLCs), representados lógicamente como tipos complejos. Un PLC permite caracterizar un lexema como una meta-entrada, capturando así alternancias sistemáticas de significado como las de (67).

    (67)
    a. Contable/Masa (p.e. 'cordero')
    b. Contenedor/Contenido (p.e. 'botella')
    c. Figura/Fondo (p.e. 'puerta')
    d. Producto/Productor (p.e. 'periódico')
    e. Proceso/Resultado (p.e. 'examen')
    f. Lugar/Gente (p.e. 'la ciudad')

    Así, por ejemplo, dados los casos de (68), que requerirían de dos entradas léxicas para 'periódico', una atribuyéndole el tipo lógico organización, otra el tipo información, ambos pueden recibir la interpretación adecuada a partir de la entrada (69), según se opere en el proceso de composición sobre el Rol Télico o sobre el Agentivo.

    (68)
    a. El periódico ha despedido a doce redactores
    b. El periódico me divierte cada día menos

    Ello es debido a la trabazón de los argumentos 'x' (de tipo organización), e 'y' (de tipo información) en una Estructura de Qualia definida por el tipo lógico complejo (o PLC) organización.información -un subtipo o especialización del PLC Producto/Productor-.
 

    (69)
    [periódico
   ARGSTR: [ARG1 : x = organización
                   ARG2 : y = información]
   QUALIA: [información.organización_PLC
                   FORMAL : y
                   TÉLICO : leer(e2,w,y)
                   AGENTIVO : publicar(e1,x,y)]]

    Hasta aquí hemos visto las líneas esenciales de la teoría de Pustejovsky. En la siguiente sección presentaré mi propuesta de representación de los grupos partitivos siguiendo este modelo.

.2 Formalización de la semántica de los partitivos
en el marco del Lexicón Generativo


6.2.1 Modelo básico: las porciones de masas
6.2.2 Combinatoria con individuales
6.2.3 Restricciones selectivas y subtipos de partitivos
6.2.4 Polisemia lógica de los partitivos: el caso de los contenedores


    En esta sección desarrollaré la representación formal de la semántica de los nombres y construcciones partitivas, tomando como ejemplo paradigmático el de los trozos y porciones de masas (§6.2.1), extendido posteriormente al de la combinatoria con nombres denotadores de entidades individuales (§6.2.2). Las especificidades de los otros tipos de partitivos se tratarán en §6.2.3, y finalmente consideraremos el caso de polisemia regular que atañe a los nombres que pueden ser usados tanto de modo predicativo -como denotadores de objetos- como en función de partitivos (§6.2.4).
 

6.2.1 Modelo básico: las porciones de masas

    La naturaleza relacional de los partitivos, como se ha dicho anteriormente, viene motivada por el hecho de que éstos pueden únicamente referir de forma completa a una entidad por relación con otro nombre o grupo nominal. En consecuencia, del mismo modo que otros tipos de predicados relacionales, como 'hermano' (70a,b) necesitan tener alcance semántico sobre otro argumento relacionado, los partitivos, si aparecen aislados, necesitan un contexto del que recuperar, abiertamente o mediante anáfora o elipsis, otro argumento de referencia (70c,d,e), (70f,g,h).

    (70)
    a. *Juan es hermano
    b. Juan es hermano de María
    c. ?? Me comí un trozo enorme
    d. Me comí un trozo enorme de pastel
    e. Era un pastel delicioso. Me comí un trozo enorme.
    f. ?? Dame dos manojos
    g. Qué rosas tan bonitas. Dame dos manojos.
    h. Dame dos manojos de rosas

    En la representación semántica desarrollada por Pustejovsky, como hemos visto en la sección anterior, se describe la posibilidad de la existencia en las estructuras argumentales de los llamados Argumentos Defectivos (default arguments), definidos como parámetros que participan en las expresiones lógicas de la estructura de qualia, pero que no necesariamente están expresados sintácticamente. Los argumentos defectivos están sujetos a clausura existencial (existential closure) y se relacionan con el argumento verdadero (true argument) en el rol FORMAL de la estructura de qualia. Considérese por ejemplo 'hermano' en (71):

    (71)
   [hermano
   [ARGSTR = [ARG1 = x: humano
                       D-ARG1 = y: humano] ]
   [QUALIA = FORMAL = hermano_de (x,y) ] ]

    De modo análogo, un partitivo tal como 'trozo' precisa de una estructura como la de (72), que dé cuenta simultáneamente de su naturaleza relacional y de su función individuadora (vid. §5.2). Esta última propiedad se ve reflejada en la representación por el hecho de que el tipo resultante (x), es siempre individual, independientemente del tipo del complemento (el Argumento Defectivo, y).

    (72)
   [trozo
   [ARGSTR = [ARG1 = x: individual
                       D-ARG1 = y] ]
   [QUALIA = FORMAL= trozo_de (x,y) ] ]

    Tal y como vimos en los ejemplos (49) del capítulo anterior, repetidos a continuación en (73), los partitivos de trozos y porciones pueden combinar con nombres denotadores de entidades individuales.

    (73)
    a. un trozo de silla
    b. una rodaja de tomate
    c. un capítulo del libro

    A pesar de ello, empezaremos a desarrollar su representación partiendo de la asunción tradicional de que el valor por defecto del complemento de un partitivo es una entidad de tipo masa - cf. Sinclair (1990) §5.1, Vossen y Copestake (1994) §3.3, Copestake y Briscoe (1995)- . Así, consideré de modo provisional que la combinatoria de partitivos de porción con nombres denotadores de entidades de tipo individual es una excepción que deberá ser tratada de modo específico.

    Por consiguiente postularemos para los partitivos de porciones una representación inicial como la de (74).

    (74)
    [porción
    ARGSTR = [ARG1 = x: individual
                       D-ARG1 = y: masa] ]

    Una de las características básicas de las entidades de tipo masa es que sus propiedades se mantienen incluso después de sufrir una partición -una [taza de café] sigue siendo [café]; un [trozo de pan] es [pan], etc.-. En consecuencia es de esperar que su función general (codificada en el rol TÉLICO de la estructura de qualia) no cambiará tras la partición. Es decir, si asumimos que los roles télicos de 'café' y 'pan' son, respectivamente, 'beber' y 'comer', también lo serán de 'taza de café' y de 'trozo de pan'.

    Este hecho se representa en (75) mediante la correferencia de los valores de los roles télicos del complemento y de la porción.

    (75)
   [porción
   ARGSTR = [ARG1 = x: individual
                       D-ARG1 = y: [masa
   TÉLICO = [1] ] ]
   QUALIA = [TÉLICO = [1] ] ]

   Por otra parte, parece obvio que, dado que la existencia de los todos es anterior a la de sus porciones, la información relativa al modo de obtención de la porción a partir del todo debe ser aportada al grupo partitivo por el contenido semántico del nombre partitivo, no por el del nombre denotador del todo. En términos del LG, el rol AGENTIVO de la construcción partitiva -en el caso de que sea relevante- debe ser un valor que no depende de la qualia del complemento, sino de la del nombre partitivo -ver (76)-. Por ejemplo asumiendo para 'pan' un valor del rol AGENTIVO del tipo cocción; sin embargo la expresión 'rebanada de pan' deberá tener para el mismo rol de la qualia un valor del tipo, p.e., cortar.

    (76)
    [porción
   ARGSTR = [ARG1 = x: individual
                       D-ARG1 = y:   [masa
                                             TÉLICO = [1]
                                               AGENTIVO = obtención-de-la-masa] ]
   QUALIA = [TÉLICO = [1]
   AGENTIVO = obtención-de-la-porción] ]

    Otro aspecto semántico del que se debe dar cuenta es que, dado que las porciones están hechas de la misma sustancia que el todo del que han sido extraídas, existe entre ambas entidades una relación merológica del tipo sustancia-entidad -la cual se codificará en LG en el rol CONSTITUTIVO de la qualia-.

    Téngase en cuenta que para un mismo concepto léxico pueden postularse diferentes tipos de relación parte-todo. Por ejemplo, [oveja], simultáneamente, tiene partes componentes como [cabeza], [patas], etc.; está hecho de [carne]; y puede ser miembro de un [rebaño].

    Así, en tanto en cuanto diferentes tipos de información parte-todo puedan afectar al comportamiento gramatical de un lexema, puede ser necesario que su rol constitutivo incorpore relaciones merológicas de tipo distinto. Este extremo se codificará asumiendo la existencia de sub-roles dentro del rol constitutivo -lo cual se implementará de modo natural en formalismos como LKB dando como valor a dicho rasgo no un valor simple sino un nuevo par atributo-valor-. Desde este punto de vista la representación de 'oveja' puede se vista -como se estableció en (36) de §4.2- como en (77):

    (77)
   [oveja
   CONSTITUTIVO = [TIENE_MATERIA = carne
                                   TIENE_PARTES = cabeza, patas, ...
                                   MIEMBRO_DE = rebaño] ]

    Sin embargo, para facilitar la exposición, en lo subsiguiente no subclasificaremos explícitamente el rol CONSTITUTIVO si no es estrictamente necesario. Por tanto, una representación como la de (78a) se notará simplemente como en (78b).

    (78)
    a. [CONST = TIENE_MATERIA = carne(x)]
    b. [CONST = carne(x)]

    En consecuencia, la representación semántica inicial del tipo general 'porción' será la de (79); dándose cuenta así del hecho de que las porciones están hechas del mismo material que el todo del que han sido extraídas.

    (79)
   [porción
   ARGSTR = [ARG1 = x: individual
                       D-ARG1 = [1] = y: masa]
   QUALIA = [CONSTITUTIVO = [1] ]]

    Por supuesto la de (79) es una representación simplificada, que debe acrecentarse con la información pertinente para los restantes roles de la QUALIA que sean relevantes. Teniendo en cuenta las consideraciones expuestas anteriormente, podemos definir de modo más preciso una porción (en principio como ejemplo típico de un nombre partitivo) como en (80):

    (80)
    [porción
   ARGSTR = [ARG1 = x: individual
                       D-ARG1 = [1] = y: [masa
                                                     TÉLICO = [2] ]
   QUALIA = [ FORMAL = porción_de(x,y)
                       TÉLICO = [2]
                       CONST = [1]
                       AGENTIVO = R(...x...)] ]

    Es decir, una porción es una entidad individual extraída de una masa, estableciendo por tanto una relación constitutiva respecto a ella y conservando su funcionalidad básica. La porción, asimismo, aporta otros tipos de información semántica propios de la misma, como por ejemplo la codificada en el rol AGENTIVO (modo de obtención de la porción) u otros. De modo más específico, muchos partitivos aportan información sobre propiedades formales de la entidad resultante. Por ejemplo, forma - barra, lámina- ; magnitud - mole, pizca-; disposición - rollo-; consistencia - zurullo-; etc.

    Este tipo de información puede ser codificado de modo explícito en formalismos como LKB del modo que se puede ver en (81a). Sin embargo, será suficiente con asumir aquí -como haremos en el resto del capítulo-, que, como es habitual en lógica y como asume Pustejovsky, ambos tipos de información semántica (el hecho de que algo sea una porción y el de que tenga una forma alargada) están expresadas de forma conjunta e indisociable en el predicado 'barra_de' que es valor del rol FORMAL (81b).

    (81)
    a.
    [barra
   QUALIA = [FORMAL = [FORMA= alargada] ] ]

    b. [barra
   QUALIA = [FORMAL = barra_de (x,y)] ]

    A partir de las decisiones tomadas hasta este momento, examinemos la composición de un caso típico de construcción partitiva de porción, 'trozo de pan'. La representación de 'trozo' será la de (82):

    (82)
    [trozo
   ARGSTR = [ARG1 = x: individual
                       D-ARG1 = [1] = y: [masa
                                                      TÉLICO = [2] ] ]
   QUALIA = [FORMAL = trozo_de (x,y)
                       TÉLICO = [2]
                       CONST = [1]
                       AGENTIVO = trocear(e,z,y,x)] ]

    Asumiremos para 'pan' una lectura de tipo masa (83), considerando por el momento que las lecturas individuadas masas ('un café', 'un pan') corresponden a extensiones de significado -por tanto, se trata de interpretaciones derivadas-.

    (83)
    [pan
   ARGSTR = [ARG1 = x: masa]
   QUALIA = [FORMAL = pan(x)
                       TÉLICO = comer(e,y,x)] ]

    La unificación de las estructuras representativas de 'trozo' y 'pan' hará que ambas contribuyan a la composición del grupo partitivo, resultando dicha co-composición en la estructura (84):

   (84)
    [trozo de pan
   ARGSTR = [ARG1 = x: individual
                       D-ARG1 = y: pan < masa]
   QUALIA = [FORMAL = trozo_de(x,y)
                       TÉLICO = comer(e,z,y)
                       CONST = pan(y)
                       AGENTIVO = trocear(e',w,y,x)] ]

    Así, la estructura resultante del grupo partitivo permite ulteriores operaciones de composición previstas por la teoría del LG, como veremos en la siguiente sección.
 

    Aplicaciones de la representación formulada

    La selección por parte de los verbos del argumento interno plantea diversos problemas de los que es preciso dar cuenta cuando el argumento se realiza mediante un sintagma partitivo.

    En primer lugar, recuérdense los casos problemáticos que se presentaban en (33) de §4.1 repetidos a continuación en (85).

    (85)
    a. Eduvigis tiene que corregir un examen
    b. Eduvigis tiene que corregir una montaña de exámenes
    c. Estoy terminando el libro
    d. Estoy terminando el segundo capítulo del libro
    e. Se ha constituido el Senado
    f. ?? Se han constituido los miembros del Senado

    Los ejemplos (85a,b) ilustraban el problema de la selección por parte de verbos de argumentos referidos mediante grupos partitivos. Si 'una montaña de exámenes' mantuviera, como es habitual, el tipo semántico del núcleo del sintagma nominal -p.e., montaña- no sería seleccionable por el verbo 'corregir', siendo pues necesario que la construcción partitiva pueda ser interpretada como una entidad de tipo examen. Siguiendo el método de composición descrito aquí es posible la construcción de frases del tipo de (85b) mediante la aplicación del mecanismo de coerción de tipos (type coertion) definida por Pustejovsky.

    Utilicemos para ejemplificarlo la estructura obtenida para 'trozo de pan' en (84) aplicada al ejemplo análogo (86):

    (86) Eduvigis se ha comido un trozo de pan

    El verbo 'comer' precisa seleccionar un argumento del tipo alimento. Utilizando la representación (84) para 'trozo de pan' un argumento de dicho tipo está al alcance del verbo como valor del rol constitutivo del sintagma partitivo (dado que pan es subtipo de alimento); con ello, la aplicación de la operación de coerción de tipo permitirá de modo adecuado la composición del grupo 'comer un trozo de pan' -y de modo análogo la de 'corregir una montaña de exámenes', 'anotar en un pedazo de papel', 'beber una copa de vino', y cualquier otro tipo de grupo verbal en que el tipo a seleccionar se halle escondido en el complemento del grupo partitivo-. En todo este tipo de casos la definición y codificación de una relación constitutiva entre la entidad denotada por el grupo partitivo (la 'parte') y la entidad denotada por el complemento de la misma (el 'todo') permitirá una adecuada composición semántica inalcanzable para los métodos habituales en los que el tipo de una frase preposicional es el del núcleo de la misma.

    En segundo lugar, considérese el caso de grupos verbales como los de (87), en los que, al contrario de lo que ocurre con los casos de (85b) y (86), las restricciones selectivas del verbo no se ven satisfechas por el tipo semántico del 'todo' (madera, película, acero) sino por el del nombre partitivo ('barra', 'rollo', 'lámina').

    (87)
    a. Quebrar una barra de madera
    b. Desenrrollar un rollo de película
    c. Doblar una lámina de acero

    También en este caso las representaciones del tipo de (84) permiten de modo adecuado la composición semántica, simplemente seleccionando de modo ordinario el argumento principal, expresado en ARG1 y en el rol FORMAL de la estructura, dando así cuenta de que es posible quebrar objetos alargados o doblar objetos de grosor mínimo -aunque en principio la materia de que estan hechos no parece ser susceptible de ser quebrada o doblada-.

    Finalmente, otro grupo de casos solventables mediante las estructuras propuestas y aplicación de coerción de tipos es el ejemplificado por (85c,d), y ampliamente discutido por Pustejovsky utilizando ejemplos del inglés como el de (88).

    (88) Enjoy the cake

    Se trata del caso de verbos que seleccionan predicados de tipo eventivo; en los ejemplos, tanto 'terminar' en español como 'enjoy' en inglés seleccionan en la posición de complemento no objetos sino acciones o procesos. En el caso de (85c,d) la interpretación de la expresión sería [estoy terminando de leer/escribir el libro/segundo capítulo del libro]; en el de (88), [enjoy eating the cake].

    Este tipo de casos los soluciona Pustejovsky también mediante aplicación de la coerción de tipos (ver §6.1), de modo que el verbo obtiene el argumento apropiado en el rol TÉLICO de la qualia del complemento: en 'cake' -como en 'pan' en (83)- dicho rasgo tiene un valor del tipo comer, el cual, al ser un subtipo de evento, permite la composición con verbos como 'enjoy'. 'Libro', en (85c) funcionaría de modo análogo, al tener codificados los tipos leer y escribir como valores para, respectivamente, sus roles TÉLICO y AGENTIVO.

    Por lo que atañe a los grupos partitivos, siguiendo la metodología de composición antes descrita -ver ejemplos (82), (83) y (84)-, también grupos como 'capítulo del libro' o 'slice of cake' combinarían, respectivamente, con verbos como 'terminar' o 'enjoy' dado que los roles apropiados de sus estructuras de qualia habrían adoptado los valores adecuados aportados por el complemento ('libro', 'cake'), por ejemplo como en las representaciones de (89):

    (89)
    a.
    [capítulo de libro
   QUALIA = [TÉLICO = leer
                       AGENTIVO =escribir] ]

    b.
    [slice of cake
   QUALIA = [TÉLICO = eat] ]

    Finalmente notemos que el tipo de composición desarrollado permite el bloqueo de ciertas expresiones no aceptables por motivos léxico-semánticos. Pustejovsky (1995) -ver §6.1- explica y hace posible la composición de frases como la de (90a) mediante el mecanismo de co-composición. Considérense al respecto, repetidas en (90b,c), las representaciones parciales de 'bake' y 'cake':

   (90)
    a. Bake a cake

    b.
    [bake
   QUALIA = [AGENTIVO = bake_act] ]

   c.
    [cake
   QUALIA = [AGENTIVO = bake_act] ]

    d. * Bake a slice of cake

    e.
    [slice of cake
   QUALIA = [AGENTIVO = slice_act] ]

    Una composición para 'slice of cake' como la propuesta anteriormente -es decir, análoga a la del sintagma español 'trozo de pan' en (84)- tendrá la virtud de, permitiendo la composición de frases como (90a), impedir la de (90d). Ello es debido a que el valor del rol AGENTIVO de 'slice of cake'/'trozo de pan', no será -como en 'cake' en (90c)- un proceso de cocido u horneado, sino un proceso de corte o troceado del todo original -véase (90e)-, información ésta que es aportada a la representación semántica del compuesto por el partitivo 'slice'.

    Hemos visto hasta aquí el caso genérico en que se asume un complemento de tipo masa para los grupos partitivos. En la siguiente sección se analizarán y tratarán algunos casos que, al menos superficialmente, parecen apartarse de esta especificación general.
 

6.2.2 Combinatoria con individuales

    Examinemos a continuación el caso de la composición de nombres partitivos con frases nominales denotadoras de entidades individuales. Trataré dos casos distintos: en el primero de ellos, tomando como ejemplo 'trozo de silla', la partición da lugar a un objeto de características notablemente distintas de las del todo de referencia; por contra, en el segundo caso, ilustrado mediante el ejemplo 'capítulo de libro', el segmento o porción mantiene la mayor parte de las propiedades del todo.

    Hasta el momento hemos asumido que los nombres partitivos, o al menos su ejemplo típico, los nombres de porción, seleccionan entidades de tipo masa. Sin embargo, constantemente podemos hallar contraejemplos, como (91), en dónde 'silla' es un nombre que parece obvio que denota una entidad individual.

    (91) un trozo de silla

    Sin embargo, como se sugirió en la sección anterior, debe notarse que 'silla' en (91), aunque en principio parece referir a un objeto individual, se realiza ostentando los rasgos gramaticales típicos de las entidades masivas. Es decir, aunque se halle en singular, no está precedido de determinante. Esta observación puede sugerir que quizá se ha producido algún tipo de reclasificación del individual a masa. Exploraremos esta intuición a continuación.

    Dada la representación semántica del partitivo 'trozo' establecida en (82), podemos hallar dos problemas principales para combinarla con la de 'silla':

    (i).- Se ha establecido que 'trozo' selecciona argumentos de tipo masa, pero 'silla' es de tipo individual.

    (ii).- La representación de 'trozo' fuerza a que el rol TÉLICO de la construcción partitiva sea correferente al del complemento sintáctico. Sin embargo, a pesar de que la función obvia de una silla es sentarse en ella, esta estipulación no puede ser mantenida para un trozo de silla.

    El punto (ii) se relaciona con el hecho de que el troceado de un objeto o entidad individual lo desmiembra o destruye. En consecuencia, en general, no puede esperarse que las porciones de entidades individuales conserven la misma función que los todos de los que se extraen. (Sin embargo, ver por el contrario más abajo el ejemplo de 'capítulo de libro').

    Abordaremos este tipo de composición como un caso de coerción de tipos. Intuitivamente, parece que la aplicación de un partitivo de porción a un individual conlleva una reclasificación de este último como entidad de tipo masa. La razón se hallaría en que la división de un objeto individual resulta en la obtención de un nuevo tipo de objeto, el cual ya no es la entidad individual de origen sino una entidad individual hecha del mismo material que ella. Por ejemplo, un trozo de silla no es una silla, sino simplemente algo hecho del mismo material que las sillas. Es decir, si una silla está hecha de madera, un trozo de silla no es otra cosa que un trozo de madera.

    Como se discutió en §4.1 -ver ejemplos (29) en dicha sección- todos los objetos están hechos de algún tipo de material -las sillas están hechas de madera, las botellas están hechas de vidrio, etc.-, y es posible en general concebir un referente de este tipo tanto en términos de entidad individual como en términos del material de que están hechos. En otras palabras, dado el contexto apropiado, a las sillas se las puede denominar 'madera', a las botellas 'vidrio', y así sucesivamente.

    La posibilidad de derivar interpretaciones de tipo masa a partir de nombres denotativos de entidades individuales (grinding o masificación) es un procedimiento que Copestake y Briscoe (op.cit.) han propuesto llevar a cabo usando Reglas Léxicas que produzcan un cambio del tipo del nominal. De modo específico, proponen reglas léxicas que tratan alternancias animal-alimento (p.e. cordero-animal -> cordero-alimento), pero que también engloban casos menos sistemáticos como el de 'dog' en (31) de §4.1, repetido aquí en (92).

    (92)
    a. The car ran over a dog ('El coche atropelló a un perro')
    b. There was dog all over the street ('Había perro por toda la calle')

    Pustejovsky (op.cit.) sugiere que las polisemias lógicas del tipo animal-alimento pueden ser representadas mediante Paradigmas Léxico-Conceptuales (PLCs, ver §6.1), los cuales se representan en el LG utilizando tipos compuestos o complejos (dotted types, x• y). A grandes rasgos, un PLC es un constructor de tipos que permite tener al alcance tres tipos distintos pero relacionados de una palabra. P.e. para 'puerta': (i) el objeto físico, (ii) la abertura y (iii) el tipo complejo obj_físico• abertura, que comprende a ambos. Así, las entradas léxicas representadas mediante PLCs -p.e. 'cordero' en (93)- son representaciones infraespecificadas en las que las unidades léxicas comparten propiedades de dos tipos; en consecuencia permiten escoger la interpretación adecuada dependiendo del contexto.

    (93)
    [cordero
   ARGSTR = [ARG1 = x: animal_indiv
                      ARG2 = y: alimento_masa]
   QUALIA = [animal_indiv• alimento_PLC
   FORMAL = R(x,y)
   TÉLICO = comer(e,w,y)
   ...] ]

    Ambas soluciones, Reglas léxicas y representaciones basadas en PLCs presentan problemas de sistematicidad. Oraciones como las de (92), y también las de (94), parecen indicar que la masificación es genéricamente aplicable, dado un contexto apropiado.

    (94)
    a. En muchas partes de África se come serpiente
    b. Aquellos caníbales estaban comiendo explorador estofado

    En consecuencia, una solución es tipificar el nodo ontológico superior animal -posiblemente incluyendo a los humanos para dar cuenta de (94b)- como animal• alimento_PLC, y dejar que todos los hipónimos hereden tal especificación. Pero ello tendría como resultado un alto número de tipificaciones como mímimo extravagantes -p.e., [serpiente] , [jirafa] , [asno] , [tarántula] , [libélula] , [explorador] , [abogado] o [agente de seguros] serían entidades de tipo animal• alimento_PLC- . De modo análogo, una regla léxica irrestricta de masificación dará como resultado una sobregeneración de sentidos.

    La otra solución consistiría en decidir caso a caso qué animales deben ser tipificados como animal• alimento -o análogamente, a cuáles se les permite ser objeto de aplicación de la regla léxica-. En dicho caso, dado que la comestibilidad es una propiedad altamente dependiente de entornos culturales, pudiera ser que el sistema de representación léxica resultante no diera cuenta de casos como los de (94).

    Para manejarse con dicho problema, Copestake y Briscoe (1995) proponen asociar información estadística a las reglas léxicas aplicables a una entrada, creando así un modelo de la probabilidad condicional de que una palabra sea usada en un sentido específico. En dicho modelo, p.e., 'cordero' tendría asociada una probabilidad alta de serle aplicada la regla que cambie su tipo original, animal, por el tipo alimento; mientras que las entradas 'serpiente' o 'explorador' tendrían asociada para el mismo parámetro un índice menor de probabilidad.

    Sin embargo, como expuse en §5.2, no trataré aquí con modelos probabilísticos de representación del conocimiento. En cambio, en consonancia con el espíritu del LG, la solución que propongo es representar de modo sistemático en la entrada léxica el conocimiento general de que todas las entidades individuales están hechas de algún tipo de material. Este tipo de conocimiento es el que subyace a las oraciones de (92), (94), (31d) de §4.1, o (49) de §5.2 -repetidas a continuación en (95a-d)-; alternancias como las de (29) discutidas en §4.1 -p.e. las repetidas en (95e,f)-; y, en general, cualquier derivación de conversión de individuales en entidades de tipo masa.

    (95)
    a. un trozo de silla
    b. una rodaja de tomate
    c. un capítulo del libro
    d. pon tomate en la pizza
    e. ¿Tienes un cigarrillo? / ¿Tienes tabaco?
    f. Trae aquí ese palo / Trae aquí esa madera

    Como se ha descrito anteriormente, la información merológica (p.e. aquí sustancia-entidad) se codifica en el rol CONSTITUTIVO. Así, por ejemplo, considérese la representación de 'silla' en (96).

    (96)
    [silla
   ARGSTR = [ARG1 = x: individual]
   QUALIA = [FORMAL = silla(x)
                       TÉLICO = sentarse(e,z,x)
                       CONST= silla_material(y:masa)] ]

    La asunción de una representación como la de (96) para entidades individuales es equivalente a la existencia de una regla irrestricta de masificación, la cual permanecerá latente hasta que el contexto desencadene su aplicación -p.e., al caer la palabra bajo el alcance de un predicado selector de argumentos de tipo masa-.

    Otros ejemplos pueden ser tomados en consideración en (97):

    (97)
    a.
    [cordero
    CONST = carne(y)]

    b.
    [botella
    CONST = vidrio(y)]

    c.
    [perro
    CONST= carne(y)]

    De este modo, la composición de 'trozo' (82) y 'silla' (96) resultará en (98) por aplicación de la coerción de tipos. El modo ordinario de composición no puede ser llevado a cabo dado que las restricciones selectivas del partitivo (masa) no son satisfechas por el tipo del complemento (individual); pero la accesibilidad del predicado de tipo masa en el rol CONSTITUTIVO de 'silla' permite la operación de coerción de tipo, con lo que los requisitos de selección de tipo del partitivo se ven satisfechos.

    (98)
    [trozo de silla
   ARGSTR = [ARG1 = x: individual
                      D-ARG1 = y: silla_material < masa]
   QUALIA = [FORMAL = trozo_de(x,y)
                       CONST = y
                       TÉLICO = TÉLICO de (y)] ]

    La representación de (98) da cuenta de que un trozo de silla es un objeto hecho del mismo material del que están hechas las sillas -p.e., madera-. Del mismo modo, construcciones como 'un trozo de cordero' o 'un trozo de botella' se compondrán a partir de 'trozo (82) y, respectivamente, 'cordero' y 'botella' (97a,b), para dar como reultado (99):

    (99)
    a.
    [trozo de cordero
    ARGSTR = [ARG1 = x: individual
                        D-ARG1 = y: carne]
    QUALIA = [CONST = carne ] ]

    b.
    [trozo de botella
    ARGSTR = [ARG1 = x: individual
                        D-ARG1 = y: vidrio]
    QUALIA = [CONST = vidrio ] ]

    El segundo efecto de este tipo de composiciones es que los roles télicos de los individuales originales -p.e. silla: TÉLICO: sentarse (e,z,x:indiv)- quedan fuera del alcance semántico de la construcción partitiva. La consecuencia subyacente es que, como se expresa en (98), el rol télico de la construcción partitiva, en el caso de que sea relevante, no es otro que el del material del que está hecha la entidad individual originaria. Es decir, el rol télico de 'un trozo de cordero' será el de 'carne', es decir, ser comido.
 

    Conservación de propiedades: el caso de 'capítulo de libro'

    El efecto descrito en la sección anterior, sin embargo, no es deseable en casos de composición como el de 'un capítulo del libro', dado que, aparte de la información constitutiva (el hecho de que un capítulo de un libro es parte de un libro), es de esperar de 'capítulo de un libro' una estructura de qualia similar a la de 'libro', es decir: AGENTIVO = escribir y TÉLICO = leer, de modo que una frase como 'empezar un capítulo del libro' pueda alcancar via coerción de tipos las mismas interpretaciones que 'empezar un libro' -[empezar a leer/escribir] -.

    La intuición que debe ser formalizada aquí es que, aunque 'libro' sea una entidad individual, su división por aplicación de 'capítulo' no resulta (como ocurría con la división de 'silla') en la destrucción de la entidad individual originaria, y en consecuencia, en la pérdida de sus propiedades. Por el contrario, parece más bien que 'capítulo' selecciona algún aspecto masivo de 'libro' (es decir, su contenido), de modo que se conserven las propiedades a tal respecto -como ocurre con el porcionado ordinario de masas-.

    Pustejovsky (1995) concibe 'libro' como un nombre que es sistemáticamnte polisémico entre [objeto] e [información] ([texto]); en consecuencia es representado en el LG mediante el tipo complejo información• obj_fís-PLC en dónde, a grandes rasgos, las propiedades de tanto los objetos físicos como de la información son accesibles de modo simultáneo a través de los mecanismos de herencia. Considérese la representación semántica de (100):

            (100)
            [un libro
              ARGSTR = [ARG1 = x: texto
                                  ARG2 = y: obj_fís]
               QUALIA = [FORMAL = contiene (x,y)
               TÉLICO = leer (e, w, x)
               AGENTIVO = escribir(e', z, x)] ]

    'Capítulo' será representado del modo habitual para las porciones, como en (80), más específicamente como un subtipo más informativo (101) que ostenta la propiedad añadida de ser no-agentivo. Como hemos visto, en general las porciones son no-télicas; es decir, no especifican una función propia sino que retienen la de la masa de referencia. La consecuencia en la representación es que el rol télico de la porción está co-indizado con el de su argumento profundo (deep argument). Además, a diferencia de lo que ocurre con partitivos como 'rebanada', 'capítulo' no implica la existencia de un modo de obtención específico a partir del todo. Por consiguiente, en el caso de 'capítulo', no sólo el rol télico, sino también el agentivo, se hallará co-indizado con el del complemento.

    (101)
    [capítulo
    ARGSTR = [ARG1 = x: individual
                           D-ARG1 = y: [masa
                                                  TÉLICO = [1]
                                                   AGENTIVO = [2] ]
   QUALIA = [FORMAL = capítulo_de (x,y)
                       TÉLICO = [1]
                       AGENTIVO = [2] ] ]

    El hecho de que el tipo de 'libro' sea complejo (información• obj_fís-PLC) da acceso por herencia, via información, al tipo masa (102a) (cf. Pustejovsky, op. cit.), permitiendo así la unificación ordinaria con el resultado de la estructura deseada para 'capítulo del libro' (102b).

    (102)
    a.
    libro < información•obj_fís < información < masa

    b.
    [capítulo del libro
   ARGSTR = [ARG1 = x: individual
                       D-ARG1 = [1] : [libro
                                                  TÉLICO = leer = [2]
                                                   AGENTIVO = escribir = [3] ] ]
   QUALIA = [FORMAL = capítulo_de (x, [1] )
                       TÉLICO = [2]
                       AGENTIVO = [3] ] ]

    Adviértase en (100) que, en 'libro', la variable ligada tanto en el rol TÉLICO como en el AGENTIVO es la relativa a texto -no la relativa a objeto-. En consecuencia, en 'capítulo del libro', los roles télico y agentivo refieren también a 'texto'/'información'. De este modo, las operaciones de coerción de tipos aplicables a 'un libro' ('empezar un libro' = [empezar a leer/escribir un libro-texto] ) serán también aplicables a 'un capítulo del libro'.

    Con el fin de abordar las líneas generales de composición de los partitivos he asumido hasta aquí que los mismos seleccionan argumentos que denotan masas homogéneas. Sin embargo, por supuesto, no todo partitivo sigue estrictamente este modo de proceder. De hecho, tan sólo una subclase puede ser descrita de este modo: las porciones que denotan bien formas ('lingote', 'barra') bien fragmentos desgajados de una masa sólida ('fragmento', 'trozo', 'rebanada'). En la siguiente sección se esbozará el tratamiento que debe darse a otros tipos de partitivos.
 
 

6.2.3 Restricciones selectivas y subtipos de partitivos.

    Otros nombres o pronombres partitivos pueden seleccionar una variedad de tipos de entidades distintas de la que se ha tratado en la sección anterior, las masas homogéneas. Considérense a continuación los casos de grupos (103a), agregados (103b), plurales determinados (103c) o indeterminados (103d), individuales no masificables (103e), o masas granulares (103f):

   (103)
    a. uno/un miembro del equipo
    b. algo/un montón/un camión de ganado
    c. uno de los aristócratas
    d. un montón/saco/kilo de patatas
    e. la cúspide de la montaña
    f. un copo de nieve

    A fin de dar cuenta de dicho repertorio de tipos seleccionables sin tener que enumerarlos como valores alternativos del argumento profundo de los partitivos, puede establecerse una generalización utilizando el tratamiento que hace Jackendoff (1991) de la delimitación y la granularidad de los conceptos léxicos.

    Recuérdese que en dicho marco de investigación (vid. §2.2.2) los rasgos ± D(elimitado) y ± G(ranular) se utilizan para dar cuenta de un amplio rango de fenómenos que atañen tanto a entidades como a eventos.

    En §7 desarrollaremos en profundidad un entorno de representación basado en dichos rasgos. Únicamente avancemos aquí que el mismo puede ser implementado para las entidades en la ontología de tipos, como en la Fig. VI.1:


 

    Recordemos además que en el trabajo de Jackendoff se asume que los plurales no determinados son conceptos [-D+G] -asimilándose conseguientemente a los agregados-. Por ejemplo, [ovejas] es visto una agregación (no delimitada) de elementos del tipo [oveja]; en consecuencia es denotacionalmente equivalente a [ganado] -compárense (104c) y (104a)-. Puede asumirse asimismo que la determinación de un plural delimita el conjunto así definido; en consecuencia un plural determinado como 'las ovejas' es asimilable a un grupo-compárense (104d) y (104b)-.

    Estas nociones son representables de forma directa en el marco del LG, simplemente usando los tipos de la fig. VI.1 para representar las implicaciones sobre delimitación, y codificando los rasgos ± D en forma de información constitutiva (es decir, información parte-todo) -de modo específico la relación elemento-entidad múltiple (o miembro-conjunto) como en (104)-.

    (104)
    a.
    [ganado
    ARG1= x: agregado < no_delimitado
    CONST = tiene_elementos(x,y:animal)]

    b.
    [rebaño
    ARG1= x: grupo < delimitado
    CONST = tiene_elementos(x,y:animal)]

     c.
    [ovejas
    ARG1= x:no_delimitado
    CONST = tiene_elementos(x,y:oveja)]

    d.
    [las ovejas
    ARG1= x: delimitado
    CONST = tiene_elementos(x,y:oveja)]

    Más allá de esta clasificación general, obviamente, cada partitivo específico ostentará sus propias restricciones de subtipo (p.e. 'bandada': aves). En algunos casos son tan restrictivas que la frase ha de ser considerada más una colocación idiomática que una construcción partitiva -como en 'una piara de cerdos-.

    La representación de los otros tipos de partitivos -aparte de las porciones- puede establecerse siguiendo las líneas generales propuestas en la sección anterior y atendiendo a sus propias especificidades, como las relativas a la selección del tipo del argumento profundo o al tipo de relación constitutiva que denotan. Por ejemplo, para partitivos correspondientes al esquema elemento-multiplicidad se postularán representaciones como las de (105):

    (105)
    a.
    [miembro
      ARGSTR = [ARG1 = x: individual
                           D-ARG1 = y: grupo]
       QUALIA = [CONST = elemento_de (y)]]

    b.
    [grupo
    ARGSTR = [ARG1 = x: grupo
                        D-ARG1 = y: [no_delimitado
    CONST: [1] = tiene_elementos(z)]]
    QUALIA = CONST = [1]]

    'Miembro' (105a) es constructor de grupos como 'un miembro del equipo', luego selecciona nombres denotadores de entidades de tipo grupo, estableciendo una relación constitutiva con la entidad seleccionada del tipo elemento_de. En este caso no se describirá (como ocurría con los partitivos de porciones) correferencia entre el rol télico del argumento seleccionado y el del grupo partitivo resultante, dado que no está claro que la función inherente de un determinado conjunto sea la misma que la de los componentes del mismo.

    'Grupo' (105b) construye expresiones del tipo 'grupo de gente' o 'grupo de personas', luego selecciona nombres de colectivos o plurales, los cuales corresponden al tipo no_delimitado granular (es decir, compuestos de elementos, lo que excluye a los nombres de tipo masa), lo cual se especifica en la representación del argumento seleccionado (D-ARG) indicando que su rol constitutivo describe una relación parte-todo del tipo tiene_elementos. Dicho valor será asimismo el adoptado, por correferencia (co-indización de [1]), por el rol constitutivo del grupo partitivo resultante, expresando así p.e. que si el concepto [gente] está compuesto de elementos del tipo [persona], asimismo [un grupo de gente] estará compuesto del mismo tipo de elementos.

    Finalmente, como ejemplo de partitivos que denotan implícitamente relaciones merológicas del tercer tipo descrito en §4.2, componente-entidad, veamos la representación de 'punta', en (106):

    (106)
    [punta
   ARGSTR = [ARG1 = x: individual
                       D-ARG1 = y: individual]
   QUALIA = [CONST = parte_de (y)]]

    'Punta', como otros partitivos de límites topológicos ('base', 'superficie', etc.) selecciona entidades individuales, y causa que la construcción partitiva resultante (p.e. 'la punta de la flecha') denote una relación de parte componente hacia el todo de referencia ('flecha'). Tampoco en este caso se definirá correferencia de roles télicos, ya que no puede establecerse que la función inherente de una parte de una entidad sea la misma que la de la entidad global.

    No desarrollaré aquí en profundidad la representación de estos tipos de partitivos, asumiendo que se establecerán a partir de las líneas generales descritas en la sección anterior -salvando las diferencias y peculiaridades pertinentes- por lo que pasaremos a examinar al caso más especial de los nombres que son sistemáticamente polisémicos entre objetos y partitivos tomando como ejemplo típico los nombres de contenedores.
 

6.2.4 Polisemia lógica de los partitivos: el caso de los contenedores

    Los nombres de contenedores son sistemáticamente polisémicos entre dos interpretaciones: el objeto (el contendor) y la porción posiblemente contenida en él (el contenido). En los casos en que el nombre no está complementado pero denota una porción debe asumirse, como es lo normal con los nombres partitivos, que, o bien se ha producido una elisión del complemento (porque dicha información es recuperable del contexto), o bien que el nombre partitivo refiere de modo anafórico al contenido de referencia. Considérense los ejemplos en (107):

    (107)
    a. Toma una copa
    b. Rompe la copa
    c. Rompe la copa de vino
    d. Un trozo de copa
    e. Se derramó la copa
    f. Se derramó la copa de vino
    g. Termina la copa
    h. Disfruta de la copa

    (107a) es ambiguo entre las interpretaciones de objeto y de bebida, mientras que el resto de ejemplos pueden tener tan sólo una de las lecturas posibles, la cual está forzada por el verbo. Así, 'romper' en (107b,c) impone a 'copa' una interpretación de objeto, independientemente de que este último nombre se halle o no complementado. De hecho, 'copa de vino' en (107c) es también ambiguo en otro sentido: puede referirse a [una copa llena de vino] o a [una copa usada habitualmente para beber vino]. El primero es el típico caso de construcción partitiva; en el segundo caso, 'copa de vino' es un típico grupo nominal con complemento preposicional. Pero en ambos casos -de modo más notable en el primero para lo que atañe a las cuestiones discutidas aquí- 'copa' puede ser interpretada únicamente como un objeto. Finalmente, 'trozo' en (107d) fuerza asimismo a 'copa' a ser interpretado como objeto dado que dicho partitivo, como se ha comentado anteriormente, es un predicado que selecciona masas sólidas.

    Por el contrario, 'derramar' selecciona líquidos; en consecuencia 'copa' en (107e) y 'copa de vino' en (107f) refieren de modo no ambiguo al contenido -el cual está explícito en (107f) e implícito en (107e)-.

    Finalmente, los verbos de (107g,h) fuerzan igualmente a 'copa' a ser interpretada como [contenido], pero con una implicación destacable: tanto 'terminar' como 'disfrutar', como se ha apuntado en la sección anterior, seleccionan un argumento interno de tipo evento; en consecuencia, en dichos casos 'copa' debe recibir una interpretación de tipo contenido-télico, es decir, [beber una copa (de vino)].

    Como hemos visto, las polisemias regulares se representan formalmente en LG mediante PCLs. Utilizando dicho mecanismo representaré aquí los nombres de contenedores como tipos complejos contenedor• contenido_PLC, como en (108), de modo que las entradas léxicas correspondientes serán constructos infraespecificados, en cuya Estructura Argumental se consignan los argumentos tanto del objeto físico como del material contenido. Considérese la representación de 'copa' en (108).

    (108)
    [copa
   ARGSTR = [ARG1 = x: objeto
                      ARG2 = y: [no_delimitado
                                          QUALIA = TÉLICO = [1] ] ]
   QUALIA = [contenedor• contenido_PLC
                       FORMAL = contiene(x,y)
                       CONST = cristal(w)
                       TÉLICO = [1] ] ]

    Ambos argumentos se relacionan en el rol FORMAL mediante un predicado contentivo, el cual da cuenta tanto de la faceta relacional de 'copa' como de su función de cuantificador relativo -'una copa de algo' es la cantidad de ese algo contenida en el objeto [copa]-.

    Su rol CONSTITUTIVO es el del objeto: el material del que el objeto está hecho. En este caso, no es necesario referirse al contenido (compárese con las representaciones de porciones en las secciones anteriores) dado que dicho tipo de información se obtiene directamente del argumento ARG2. Ello es debido a que los contenedores son objetos semánticamente complejos, en los que ambos tipos están disponibles simultáneamente, no simplemente predicados relacionales monomórficos como los partitivos puros ordinarios de tipo porción -en donde sólo hay un argumento verdadero: porción < individual-.

    Finalmente, tal como sucede con las porciones, el rol télico es correferente con el de la masa de referencia.

    Por consiguiente, sea la entrada léxica de 'vino' en (109) -una representación típica de los nombres de masa, como la de 'pan' en (83)-:

    (109)
    [vino
   ARGST = [ARG1 = x: masa]
   QUALIA = [FORMAL = vino(x)]
   TÉLICO = beber(..., x, ...)]

    La co-composición de (108) y (109) da como resultado la representación de 'copa de vino' en (110):

    (110)
    [copa de vino
   ARGSTR = [ARG1 = x: objeto
                      ARG2 = y: [vino
                                          QUALIA = TÉLICO = beber(..., y, ...)] ]
   QUALIA = [FORMAL = contiene(x,y)
                       CONST = cristal(w)
                       TÉLICO = beber(..., y, ...)] ]

    El efecto conseguido es que las estructuras (108) y (110) dan cuenta de los casos problemáticos expuestos en (107) del siguente modo:

    (i)- Los requisitos de selección de argumentos tanto de 'romper' (107b,c) como de 'derramar' (107e,f) se ven satisfechos mediante la selección respectiva de los argumentos ARG1 (el objeto) o ARG2 (el contenido) en (108) o (110). En el caso de (107e) la sustancia que se vierte no está manifestada de modo explícito, sino que se expresa mediante clausura existencial:

existe x existe y derramarse(e,y) & no_delimitado(y) & copa(x) & contiene (x,y) [... ]
 

    (ii)- En el caso de 'trozo' (107d) la composición procederá como se describió en §6.2, es decir, mediante selección del valor del rol CONSTITUTIVO de (110), el cual refiere al objeto -dando cuenta por consiguiente de que un trozo de copa es un trozo de cristal-.

    (iii)- Las restricciones selectivas de 'terminar' y 'disfrutar' (107g,h) se ven satisfechas por coerción del tipo del complemento, el cual adopta el de su rol TÉLICO: beber.

    (iv)- Finalmente, la ambigüedad de (107a) radica en la del verbo, 'tomar', el cual puede ser interpretado tanto como [agarrar, asir] como en el sentido de [ingerir]. En cualquiera de los dos casos el sentido correspondiente del lexema seleccionará el argumento apropiado del complemento: ARG1 (objeto), o ARG2 (sustancia contenida).

    Hemos visto en esta sección y en la anterior el desarrollo formal de la semántica léxica de los partitivos en el marco de la teoría del LG. Como hemos dicho, este nivel abstracto de formalización es implementable en el formalismo de estructuras de rasgos de LKB. En la sección siguiente tomaremos en consideración diversos aspectos que conciernen a dicho cambio de nivel descriptivo.

6.3 Conclusiones


    En español y en muchas otras lenguas las entidades individuales pueden ser referidas, aparte de mediante sintagmas nominales con núcleo predicativo, mediante construcciones partitivas (con núcleo relacional). Estas últimas muestran una serie de propiedades semánticas que difieren en varios aspectos de las de los primeros. De modo especial, algunas de sus propiedades compositivas parecen no depender de las propiedades semánticas del núcleo (el partitivo) sino de las del complemento (el nombre que denota el todo de referencia).

    Para dar cuenta de ello, en este capítulo he desarrollado una propuesta de representación léxica de los nombres partitivos y de composición de los grupos de los que son núcleo sintáctico, capaces de dar cuenta de una amplia gama de fenómenos derivados de las propiedades semánticas de las construcciones partitivas. El mecanismo compositivo aplicado, la co-composición (Pustejovsky 1991,1995), permite que tanto el nombre partitivo como su sintagma nominal complemento contribuyan de forma equilibrada a crear para el compuesto resultante una estructura léxica que resulte apropiada para participar en ulteriores operaciones de composición, del mismo modo que lo hacen el resto de sintagmas nominales.

    Para describir y formalizar la semántica de los partitivos, he tomado los nombres de trozos, segmentos o porciones de masas (p.e. 'trozo de pan') como caso prototípico a partir del cual, realizando las adaptaciones necesarias en cada grupo de casos, se podrá proceder a la descripción y formalización de los otros tipos de nombres y construcciones partitivas. En este caso básico el grupo partitivo denota un objeto individual ('trozo de pan') creado a partir de la segmentación de una entidad de tipo masa ('pan'), en el que la porción conserva las propiedades funcionales de la masa de origen.

    Tomando como punto de partida las estructuras que dan cuenta del caso básico, he descrito y formalizado en la creación de grupos partitivos en que el todo de referencia es una entidad de tipo individual (p.e. 'trozo de silla'). El análisis correspondiente parte de la consideración de que, en este tipo de casos, lo que el partitivo selecciona de hecho es el aspecto masivo del objeto de referencia, dando así cuenta de que 'un trozo de silla' no es un objeto que conserve las propiedades funcionales de las sillas, sino de la materia de que éstas están hechas. En otras palabras, se da cuenta de que 'un trozo de silla' es fundamentalmente un trozo de madera (o del material constitutivo de la silla: plástico, acero, etc.).

    A continuación, como caso especial de la combinatoria de nombres de porción con entidades individuales, he tratado el de aquellos sintagmas, como 'un capítulo del libro', en que el grupo partitivo no únicamente conserva las propiedades funcionales del todo de referencia, sino también las agentivas o de creación de la entidad. Es decir, aquéllos en que el proceso de obtención de la porción (el capítulo) corresponde al propio proceso de obtención del todo (el libro). En el caso propuesto, un [capítulo de un libro] se obtiene, al igual que el [libro] completo, mediante un mismo proceso: la escritura -y no como en los casos anteriores mediante un proceso de segmentación de un todo preexistente-.

    Como se ha argumentado en capítulos anteriores, las construcciones partitivas son, como los nombres predicativos, modos de individuación de entidades. En consecuencia, al igual que los nombres predicativos, establecen relaciones parte-todo respecto a otras entidades del modelo del mundo, relaciones que se codifican en el rol CONSTITUTIVO de la entrada léxica. Las construcciones desarrolladas en profundidad en este capítulo corresponden a uno de los tres esquemas merológicos básicos definidos en §4, el esquema sustancia-entidad. Dicha relación se fundamenta en la asunción de que la mayoría de entidades son conceptualizadas por los hablantes como compuestas de algún tipo de materia o sustancia. Posteriormente he apuntado las líneas de desarrollo para la formalización de las construcciones partitivas correspondientes a los otros dos esquemas merológicos: elemento-multiplicidad (construcciones en las que se ven implicadas las nociones de elemento, grupo, agregado o pluralidad, como 'miembro del Senado', 'grupo de gente' o 'uno de los senadores') y parte-entidad (como 'punta de flecha' o 'pieza de un coche').

    El desarrollo de la estructura semántica de las construcciones partitivas no corresponde a un mero ejercicio descriptivo, sino que permite dar cuenta de forma unificada de múltiples casos de combinatoria de verbos con sintagmas nominales partitivos. Hemos visto tanto los casos en que el verbo selecciona entidades denotadas por grupos partitivos de acuerdo con las propiedades del todo de referencia (como en 'comer un trozo de pan' o 'empezar el capítulo de un libro'), como aquéllos en que la selección se realiza de acuerdo con las propiedades del partitivo ('doblar una lámina de acero'). De entre los primeros, cabe destacar que los mecanismos de composición previstos por la teoría del Lexicón Generativo permite dar cuenta tanto de operaciones combinatorias basadas en el tipo semántico básico del sintagma nominal (como en 'comer un trozo de pan', en donde 'comer' selecciona argumentos de tipo comida) como operaciones basadas en tipos subyacentes expresados en las estructura de qualia -como en 'empezar el capítulo de un libro', en donde de 'capítulo de libro' se recuperan argumentos de tipo leer o escribir, obteniendo las interpretaciones [empezar a leer/a escribir el capítulo de un libro]-.

    Finalmente, se ha dado cuenta del caso de los nombres sistemáticamente polisémicos entre nombres predicativos o referenciales y partitivos relacionales, usando como caso típico el de los nombres de contenedores. Dichos nombres son tratados como PLCs de modo que se postula para ellos representaciones infraespecificadas apropiadas para dar cuenta en cada caso del sentido apropiado dependiendo del contexto.

7. Polimorfismo léxico: alternancias de modo de referencia
y restricciones selectivas de los partitivos



7.1 Polimorfismo léxico
7.2 Clasificación de los nombres partitivos en función de sus restricciones selectivas
7.3 Consideraciones finales


    Como hemos visto en §5 y §6, la especificación de las restricciones selectivas de los nombres partitivos plantea diversos problemas, siendo el principal el de la aparente heterogeneidad de los tipos de argumento que seleccionan. Con el fin de hallar una expresión regular de dicho problema formal desarrollaré en este capítulo un método para la representación de los diversos modos de referencia nominal basado parcialmente en Jackendoff (1991) -ver §2.2.2- y en las nociones de referencia discreta y cumulativa de Bunt (1981) -ver §4.1-.

    En general, el sistema de representación formal de los niveles básicos de referencia léxica que aquí se presentará está motivado por la necesidad de dar cuenta de la individuación al tratar diversos aspectos del conocimiento parte-todo relativo a los nominales. Además, el formalismo puede ser tomado como un modelo de un aspecto particular de la competencia léxico-semántica de los hablantes de español, en el que las alternancias en el modo de referencia a las entidades se derivan de las especificaciones semánticas que se consideran prototípicas para cada tipo de entidad. Este análisis se basa en el del efecto prototípico de lexicalización inicial descrito por Langacker (1991) -ver §2.2.1 y §5.1-, del que es un desarrollo y una adaptación al presente marco de representación.

7.1 Polimorfismo léxico


    7.1.1 Un caso de polisemia lógica: las alternancias de referencia
    7.1.2 Marco de representación
    7.1.3 Algunos datos lingüísticos
    7.1.4 Descripción del sistema
    7.1.5 Ejemplos de derivaciones
    7.1.6 Recapitulación


    Las relaciones parte-todo entre entidades, como hemos visto, no son simplemente un problema de relaciones meronímicas (p.e. 'silla' TIENE_PARTE 'patas') sino que debe situarse en el marco de la capacidad general de los hablantes de referirse a una misma entidad mediante mecanismos diferentes, dependiendo de la faceta semántica de la entidad que se desea destacar o enfatizar en un acto comunicativo dado. Por ejemplo, una misma realidad, un [trozo alargado de madera que se ha desgajado de una silla] puede ser referido como mínimo de los siguientes modos.

    (111)
    a. La pata de una silla
    b. Un trozo de silla
    c. Una barra de madera
    d. Madera
    e. Un palo

    En (111a) se destaca la relación funcional entre la entidad en cuestión y una entidad más general de la que forma parte. En (111b) el foco semántico apunta a que la entidad a que se refiere el sintagma ha sido desgajada de la entidad más general (la silla). En (111c) el énfasis se hace en la forma de la entidad y en el material de que está hecha. En (111d) únicamente en dicho material. Y en (111e) el foco de atención es la entidad en sí, sin referencia alguna a relación de inclusión previa, sino con atención primordial a su forma y, de modo implícito, a su función.

    Tómemos en consideración los modos de referencia ejemplificados por (111b,c), es decir, en la individuación mediante construcciones partitivas. Recuérdese (ver §5.2) que dichas construcciones se manifiestan típicamente en español en forma de una frase nominal en la que el partitivo ('trozo', 'barra') es el núcleo sintáctico, mientras que el nombre referente al todo ('silla', 'madera') muestra las siguientes características: (i) es el término nominal de una frase preposicional introducido por la preposición 'de'; (ii) está en singular; (iii) no está determinado (la llamada determinación-cero es la marca habitual de los nombres de masa) ; y (iv) habitualmente denota el tipo de material del que la entidad está hecha.

    Debido a las dos últimas razones este fenómeno es conocido habitualmente como la relación o la individuación porción-masa (Winston et al. 1987, Langacker 1991, Copestake 1992). Recordemos en (112) diferentes tipos de construcciones partitivas de este tipo:

    (112)
    a. CONTENEDORES: Un vaso de vino
    b. PORCIONES (divisiones): Una rodaja de limón
    c. PORCIONES (formas): Un lingote de oro
    d. ELEMENTOS: Un grano de arroz
    e. LÍMITES: La punta de la lengua

    Pese a que los casos de (112) suelen ser los considerados más típicos, recordemos que no siempre se da el caso de que el nombre del todo denote una masa o substancia, ni que se halle en singular, ni que su pluralización denote siempre el mismo tipo de entidad.

    (113)
    a. Una rodaja de limón
    b. Un saco de manzanas
    c. Una caja de cervezas
    d. Una caja de vinos

    Considérense los ejemplos de (113), y nótese que: (i) el referente de 'limón' en (113a) no puede ser una masa o sustancia, sino una entidad individual, no en vano la forma de la porción ('rodaja') depende directamente de la forma del todo ('limón'); (ii) tanto 'manzanas' como 'cervezas' en (113b,c) son formas plurales, y no denotan sustancias sino una acumulación indeterminada de entidades individuales; (iii) en el caso de (113c), de modo especial, la la referencia es a dosis convencionales de una sustancia: probablemente botellas; y (iv), la interpretación preferente de (113d) es de un muestrario o repertorio de clases o tipos de vino.

    Este tipo de fenómenos nos llevarán a postular que dichas construcciones partitivas, más que denotar individuación a partir de masas o sustancias, lo que en realidad realizan es una individuación a partir de lo que deminaremos referencia cumulativa de entidades.
 
 

7.1.1 Un caso de polisemia lógica: las alternancias de referencia

    En esta sección se analizarán los tipos de polisemia lógica que implican cambio de modo de referencia. Los hablantes tienen la capacidad de referirse a conceptos fuertemente relacionados semánticamente mediante el mismo lexema. 'Whisky', por ejemplo, puede ser usado para referirse a una sustancia ('bebo whisky'), a entidades discretas o dosis ('he pedido dos whiskies'), a clases de entidades ('los whiskies más vendidos son el malta y el blended'), o de modo genérico a una clase ('el whisky es bueno para la salud').

    Como hemos visto anteriormente, parecen existir en el lenguaje (al menos en español) dos modos básicos de denotar entidades: uno atendiendo a las entidades como a cosas independientes, individualizadas y con forma (p.e. 'silla', 'anillo'); y otra atendiendo a la sustancia de que las entidades están hechas (p.e. 'madera', 'oro'). Ambos modos se hallan relacionados respectivamente con los modos básicos de referencia descritos por Bunt (1981): discreto y cumulativo.

    En el primer caso un cúmulo de entidades de un cierto tipo se expresa lingüísticamente como una pluralidad de las mismas (silla + silla = sillas); y una partición de una de dichas entidades deja de ser una de ellas (si se rompe una silla en pedazos, ninguno de dichos pedazos es una silla). En el segundo caso, la acumulación se expresa (en singular) como una masa mayor del mismo tipo (madera + madera = madera); y una partición sigue siendo una entidad del mismo tipo (si se divide algo llamado 'madera', las porciones siguen pudiendo ser denominadas 'madera').

    De modo relacionado, se asume habitualmente que los conceptos léxicos se pueden clasificar en cuatro tipos básicos de acuerdo con su comportamiento lingüístico -cf. Talmy (1978), Jackendoff (1991)-: individuales ('árbol'), masas ('oro'), grupos ('equipo') y agregados ('ganado'). La atribución de un lexema a uno de los tipos básicos parece ser algo que no siempre se puede inferir directamente de como son las cosas en realidad sino que depende de cómo se conceptualizan en un lenguaje dado.

    Por ejemplo, en español e inglés, por una parte los líquidos suelen ser referidos de modo cumulativo y por otra los coches suelen ser referidos como entidades discretas; pero piénsese por contra en frases como 'me tomé dos cervezas' o en 'hay mucho tráfico en la N-II' en dónde el modo de referencia parece ser el inverso al esperado -[cerveza]: discreto, [coches]: cumulativo-.

    Por otra parte, no parece existir una diferencia perceptual u objetiva suficiente entre [arroz] y [lentejas] que justifique por qué ambos conceptos se tratan a dicho respecto de modo diferente en el lenguaje -[arroz]: cumulativo, [lentejas]: discreto-. Más bien parece que tanto el tipo real de entidad como la convención lingüística, actuando de modo conjunto, causan que los lexemas se adscriban a uno u otro de los tipos léxico-conceptuales básicos (individual, masa, grupo, agregado); y que cada uno de dichos tipos es referido de modo preferente mediante una manera prototípica de referencia (individuales y grupos: de modo discreto; masas y agregados: de modo cumulativo).

    Sin embargo, tipo de entidad y modo de referencia son nociones distintas: dado el contexto apropiado, muchos lexemas pueden ser usados en modos de referencia distintos del prototípico para ellos. Recuérdense los ejemplos antes citados y repetidos en (114):

    (114)
   a. Bebo whisky (prototípico: CUMULATIVO-substancia)
   b. He pedido dos whiskies (DISCRETO-unidades)
   c. Los whiskies más vendidos son el malta y el blended (DISCRETO-clases)

    Asumiendo que [whisky], por ser un líquido, es de tipo masa, los usos (114b,c) pueden ser vistos como extensiones de significado, es decir, como derivaciones a partir de un sentido básico.

    En LRL-LKB dichas transformaciones se representarán formalmente mediante reglas léxicas; para cada tipo de concepto léxico se asumirá un sentido básico o prototípico, a partir del cual las reglas léxicas derivarán los sentidos extendidos. El sentido prototípico será el único presente de modo estático en el lexicón.
 
 

7.1.2 Marco de representación

    Como anuncié en §6, el sistema que desarrollaré a continuación se describirá utilizando estructuras de LRL-LKB, y no el nivel más abstracto de LG -en el que se fundamenta en general LKB-. Por consiguiente, algunas especificaciones lingüísticas que aquí se representarán mediante reglas léxicas podrán corresponder a constructos infraespecificados de Pustejovsky (1995). Por otra parte, aunque las entradas de LKB expresan todos los niveles de la estructura de qualia de LG, aquí se manejarán únicamente los roles FORMAL y CONSTITUTIVO, por ser los únicos relevantes para la exposición.

    En otro orden de cosas, recordemos que los niveles superiores de la ontología de tipos subyacente al formalismo se organizó en §6 siguiendo la división de Jackendoff (1991) entre conceptos delimitados y no delimitados. Esta división se verá asimismo reflejada en el rol FORMAL de las estructuras de qualia, ya que dicho rol, por definición, expresa en LG el tipo fundamental de la entidad. Sin embargo, en las representaciones esquemáticas que veremos a continuación, reflejaremos en el rol FORMAL únicamente la distinción básica delimitado/no_delimitado; los subtipos precisos de dicho par de tipos generales (individual, masa, grupo, etc.) se expresarán como valores del descriptor tipo, como por ejemplo en (115):

    (115)
    [silla
    FORMAL = delimitado
    TIPO = individual]

    Aunque en las descripciones prototípicas o iniciales el valor de tipo será necesariamente un subtipo de la distinción establecida en el rol FORMAL, se permitirá que ello no ocurra en las estructuras derivadas. De este modo el formalismo podrá reflejar, p.e., que una entidad de tipo individual puede ser expresada de modo cumulativo o formalmente no delimitado, como en el caso de los plurales -ver (116)-, ya que se considera que dichas formas léxicas expresan conceptos no delimitados pero mantienen de modo subyacente la noción de tipo individual -el tipo de las entidades originales agrupadas en la pluralidad-:

    (116)
    [sillas
    FORMAL = no delimitado
    TIPO = individual]

    Asimismo, el otro tipo de distinción definido por Jackendoff, la dicotomía entre conceptos granulares y conceptos no granulares, se verá reflejado de un modo genérico en el rol CONSTITUTIVO. En los esquemas que utilizaremos usaremos por simplicidad únicamente los rasgos [±G] en lugar de los descriptores completos. Así, la relación merológica básica elemento-entidad_múltiple -expresada en nuestra interpretación de LG en §6 mediante los descriptores elemento_de y tiene_elementos- corresponderá, como se estableció en §4, al rasgo [+G]. Los otros dos esquemas básicos, materia-entidad y componente-entidad, se notarán simplemente con el rasgo [-G] -ver ejemplo (117)-; de hecho, la presencia del rasgo [-G] simplemente expresará la ausencia de granularidad en la relación constitutiva.

(117)
a.
[ganado
CONST = +G:animal]

b.
[animal
CONST = -G]

    En cuanto a la ontología de tipos, realizaremos una nueva interpretación: se asumirá que los términos genéricos denotan un tipo de entidad abstracta: la clase -ver fig. VII.1 a continuación y comparar con la ontología de la fig. VI.1 de §6, que no refleja distinción entre entidades físicas y abstractas-. Las entidades no se adscribirán inicialmente al tipo clase, sirviendo únicamente este tipo para describir operaciones de generalización -ver §7.1.4-.


Fig. VII.1. Ontología
 

    La ontología de la fig. VII.1 permitirá reflejar en las estructuras el análisis de Lyons (1977) relativo a que una expresión genérica no puede ser vista como la mera extensión máxima de todas las entidades de un tipo. Es decir, que una oración como 'las manzanas son deliciosas' no puede ser interpretada como [todas y cada una de las manzanas son deliciosas]. Según el análisis de Lyons, asumido aquí, los términos genéricos deben ser vistos como una entidad (abstracta) que es el resultado de la abstracción de las propiedades de la entidad de la que derivan. En el caso del ejemplo anterior, lo que debe entenderse a partir de 'las manzanas son deliciosas' es que [en general, es una propiedad de las manzanas el ser deliciosas], aunque pueda darse el caso de que topemos con alguna manzana de sabor desagradable.
 
 

7.1.3 Algunos datos lingüísticos

    Como hemos dicho, una de las razones por las que es relevante dar cuenta de los diferentes modos de referencia en el lenguaje en un sistema de procesamiento computacional es la de que cada modo de referencia está asociado típicamente a diversos tipos de especificadores y de marcas de número. Veamos a continuación algunos ejemplos relacionados con este tema.

    Los nombres inherentemente delimitados (118) aceptan singular y plural y pueden combinar con numerales y cuantificadores plurales indefinidos:

    (118)
    a. un coche
    b. dos coches
    c. el coche
    d. los coches
    e. aquel coche
    f. aquellos coches
    g. muchos coches
    h. un equipo
    i. dos equipos
    j. el equipo
    k. los equipos
    l. aquel equipo
    m. aquellos equipos
    n. muchos equipos

    Los nombres de (118) pertenecen a los tipos individual o grupo. Los nombres de masa pueden responder a este tipo de comportamiento tan sólo en el caso de que su tipo semántico cambie al de individual, es decir, si denotan dosis individuadas de la masa o sustancia:

    (119) un/dos/el/los/aquel/aquellos/muchos whisky(ies)

    Además, debe notarse que el modo habitual de construir la referencia discreta a partir de nombres de masa es mediante construcciones partitivas (120a,b), algo que también puede ocurrir con los nombres de agregados (120c):

    (120)
    a. un vaso de whisky
    b. un cesto de arroz
    c. una vagón de ganado

    Por otra parte, los agregados se diferencian de los nombres de masa en que no pueden combinar ni con numerales ni con determinantes y cuantificadores en plural para construir referencia discreta o individuada (121a). Posiblemente deba concluirse que los agregados no admiten strictu sensu referencia discreta, sino únicamente extracción de elementos mediante construcciones partitivas (121b):

    (121)
    a. * un/dos/los/aquellos/muchos ganado/s
    b. una cabeza de ganado

    La llamada determinación-cero es la marca habitual de la referencia cumulativa (122). En dicho caso los conceptos no delimitados difieren de los delimitados en que los primeros no admiten plural (122c,d,e,f). Los conceptos de tipo individual pueden ser usados tanto en singular como en plural (122a,b) con el significado de cúmulo de entidades, aunque por supuesto es más habitual en plural. Nótese que (122a) y (122b) son expresiones sinónimas dado que, aunque 'tomate' en (122a) esté en singular, el nombre no refiere únicamente a un tomate, sino a todos los tomates del comercio en cuestión. Por otra parte, en cambio, la acumulación de grupos parece poder expresarse únicamente en plural (122g,h).

    (122)
    a. Vendemos tomate barato
    b. Vendemos tomates baratos
    c. Vendemos agua
    d. ?Vendemos aguas
    e. Tengo ganado
    f. *Tengo ganados
    g. Tengo rebaños en Canadá
    h. *Tengo rebaño en Canadá
    i. Me gustan los spaghetti con tomate
    j. Voy a comprar un bote de tomate

    Otro tipo de referencia cumulativa a partir de entidades individuales es la expresada por (122i). Como hemos visto en capítulos anteriores -p.e. ver (10c,d) de §2.2.2 y (92) y (94) de §6.2, repetidos a continuación en (123)-, se trata de aquellos casos en que se produce una reclasificación de individuales en masas.

    (123)
    a. There was dog all over the street ('Había perro por toda la calle')
    b. John eats lamb. ('John come cordero')
    c. En muchas partes de África se come serpiente
    d. Aquellos caníbales estaban comiendo explorador estofado

    En los casos de (123) la entidad referida no es una acumulación de individuos sino una masa compuesta del mismo material del que están hechos los mismos. En el ejemplo análogo de (122i), la cosa referida por la palabra 'tomate' es algo así como el jugo, la pulpa, o una elaboración indeterminada de la cosa original. En español, en este modo de referencia a entidades, el referente de tipo masa se expresa en singular y sin determinante.

    Por otra parte, dado que el tipo de concepto léxico ha cambiado de individual a masa, al nuevo concepto puede ser tratado en lo sucesivo como cualquier otro concepto de masa. Por ejemplo, puede ser individuado en dosis mediante construcciones partitivas, como en (122j), repetido a continuación en (124):

    (124) Voy a comprar un bote de tomate

    Debe tenerse en cuenta que no siempre sucede que en cualquier par individual-masa (resultante de una derivación en uno u otro sentido, llamémosles masificación o individuación), la relación entre el par de lexemas tiene referentes físicos -como sí se da en los casos tomate-fruto-> tomate-salsa o cordero-animal-> cordero-carne-. En muchos casos dicha relación es estrictamente conceptual, es decir, como si la materia de referencia del concepto masivo no fuera el material de qué está hecho el objeto sino el material de qué está hecho el concepto. Me refiero a los casos en que el concepto masivo establece una relación que se puede considerar metonímica con el concepto individual. Dicha relación suele estar originada en propiedades atribuidas al concepto léxico original, posiblemente en muchos casos, su función, como en los ejemplos de (125), en dónde (125a,c) denota entidad individual y (125b,d) un concepto masivo relacionado con las propiedades fundamentales de la entidad individual

    (125)
    a. Tengo una información explosiva
    b. Nuestro objetivo es ofrecer información veraz
    c. El fugado estaba buscando un refugio
    d. Dame refugio, suplicó.

    Los casos como los de (125) no se abordarán aquí, aunque se considerará que son tratables del mismo modo y a partir de los mismos esquemas utilizados para la descripción de las alternancias de referencia relativas a entidades físicas. P.e., en el caso de (125a,b), si consideramos el tipo masa como prototípico para 'información', un concepto como el de (125a), [una información], será visto como una dosis de [información] (al estilo de la derivación [café] -> [un café]), es decir, una unidad individual, conceptualmente delimitada, compuesta del mismo tipo de material semántico del que está hecho [información].

    En lo tocante a la referencia genérica, nótese que ésta puede expresarse asimismo mediante individuales tanto en singular como en plural (126). Además, pueden combinar con artículos, tanto definidos (126a,b) como indefinidos (126c):

    (126)
    a. El león es un animal fiero
    b. Los leones son unos animales fieros
    c. Un león es un animal fiero

    Sin embargo, sólo se aceptará el singular en el caso de masas y agregados. Véanse los ejemplos de (127): 'agua' y 'gente' son interpretados genéricamente en (127a,c), pero su pluralización en (127b,d) será interpretada como clases o tipos de entidad:

    (127)
    a. El agua es buena para la salud
    b. Las aguas son buenas para la salud
    c. La gente es estupenda
    d. Las gentes son estupendas

    Por el contrario, los grupos parecen aceptar únicamente referencia genérica en plural:

    (128)
    a. Los rebaños son necesarios para la economía del país
    b. ?? El rebaño es necesario para la economía del país

    En la siguiente sección pasaremos a describir el sistema de representación que pretende dar cuenta de los fenómenos descritos en la presente.
 
 

7.1.4 Descripción del sistema

    En esta sección propondré en primer lugar un modo de representación unificada de los tipos de entidad y los modos de referencia a los mismos dando lugar a las diversas clases de conceptos léxicos nominales. En segundo lugar presentaré el conjunto de reglas léxicas que darán cuenta de la formación de conceptos léxicos derivados.
 

    7.1.4.1 Representación unificada de tipos de entidad y modos de referencia

    Utilizaremos tres únicos parámetros para dar cuenta de modo unificado tanto de los diversos tipos de concepto léxico como de los modos de referencia, y de la intersección e interacción entre ambos: delimitación, granularidad y tipo.

    En cuanto a los modos de referencia consideraré relevantes los cuatro siguientes: Discreto, Cumulativo, Genérico y Clases, entendiendo por este último la referencia a subtipos de una clase genérica, como en (114c) ('los whiskies más vendidos son el malta y el blended'). Otros tipos de distinciones relativas a la referencia -p.e. definida vs. indefinida ('algunos albaricoques' vs. 'aquellos albaricoques'), vid. Lyons (1977)- no se tienen en cuenta, considerándose que son distinciones ulteriores aplicables a los modos básicos.

    Las descripciones mínimas de los tipos de entidad, utilizando los rasgos de Jackendoff (1991), serán las que se presentan a continuación en la tabla VII.1.
 

    modo

    tipo

    formal

    constitutivo

    INDIVIDUALES

    individual

    +D

    -G

    MASAS

    masa

    -D

    -G

    GRUPOS

    grupo

    +D

    +G

    AGREGADOS

    agregado

    -D 

    +G

Tabla VII.1: Definición de los tipos de entidad


Fig. VII.2: Representación intuitiva de entidades y rasgos de Jackendoff
 

    Para facilitar la exposición utilizaré diagramas gráficos representativos de la clase de concepto léxico que se utiliza. Los conceptos delimitados serán representados por círculos continuos, los no delimitadas por círculos discontinuos, y los conceptos genéricos (clases) por cuadrados (continuos, ya que se consideran conceptos delimitados). En cuanto a la estructura interna de los conceptos, la multiplicidad se verá reflejada por la inclusión en las figuras de elementos de algún tipo, y la no granularidad (masa) por una trama gris. Véase una representación en ese estilo de los tipos de entidad en la fig. VII.2.

    Aplicando los mismos rasgos de Jackendoff, definiremos los modos básicos de referencia del modo expuesto en la tabla VII.2.
 

modo

tipo

formal

constitutivo

DISCRETA

 

+D

 

CUMULATIVA

 

-D

 

GENERICA 

clase

+D

 

CLASES 

clase

-D 

+G:clase

Tabla VII.2: Definición de los modos de referencia

    Véanse asimismo en la fig. VII.3 algunos ejemplos mediante la representación intuitiva:
 


Fig. VII.3: Ejemplos de representación mediante diagramas
 

    Como se sugirió antes, las entidades de un tipo pueden ser referidas mediante un modo de referencia distinto del que es prototípico para las mismas. En consecuencia, los tipos de entidad y modos de referencia intersectan y se puede dar cuenta de los mismos de modo unificado, como en el esquema de la fig. VII.4, que utilizando el modo intuitivo de representación puede ser vista también como en la fig. VII.5. Los recuadros en trazo grueso corresponden a los modos prototípicos de referencia para cada tipo de entidad, a partir de los cuales se construirán los conceptos derivados mediante la aplicación del sistema de reglas léxicas.

Fig. VII.4: Tipos y modos de referencia. Descripción mediante rasgos.
 

Fig. VII.5: Representación intuitiva de los conceptos léxicos
 

    Vista la representación formal de entidades y modos de referencia, describiré a continuación el sistema de reglas que causa las derivaciones entre conceptos lexicalizados.
 

    7.1.4.2 Reglas léxicas

    En la definición estructural de las reglas léxicas, las especificaciones de entrada de las mismas restringen el tipo de concepto sobre el que son aplicables; sin embargo, debe tenerse en cuenta que, una vez derivado el modo de referencia original, el concepto resultante está capacitado para sufrir el efecto de nuevas reglas léxicas apropiadas para su nuevo estado. P.e., una vez derivado [cerveza] (botella) a partir de [cerveza] (sustancia, masa), cualquier regla léxica aplicable a individuales discretos es aplicable a [cerveza] (botella), p.e. su pluralización, como en oraciones como la de (129):

    (129) trae cervezas (botellas-CUMULATIVO)

    Utilizaremos en el sistema cinco reglas léxicas: de individuación, de masificación, de plural, de cumulación y de generalización. Las dos primeras provocan cambio de tipo del concepto léxico (reclasificaciones entre masas e individuales), mientras que el resto únicamente causan cambio en el modo de referencia, dentro del mismo tipo.

    La regla de Individuación (fig. VII.6) es un modelo de la capacidad de los hablantes de designar entidades individuales a partir de nombres de masa, construyendo así, por ejemplo, el concepto de dosis convencional, -p.e. [cerveza] (masa) -> [cerveza] (dosis, botella)-.


Fig. VII.6. Regla de Individuación
 

    La regla de Masificación (fig. VII.7) es un modelo de la capacidad inversa:
 


Fig. VII.7. Regla de Masificación o grinding
 

    La regla de pluralización (fig. VII.8) describe la capacidad de designar una multiplicidad de elementos de un mismo tipo. P.e. permite la construcción tanto de la referencia cumulativa a partir de entidades individuales -manzanas, cervezas (botellas)- como de la referencia a subclases a partir de la especificación de referencia genérica -[vinos] o [manzanas] (múltiples clases) a partir de [vino] o [manzana] (genérico, es decir, una clase)-. La regla en este caso está más especificada que la de Jackendoff (1991) dado que:

    (i) se especifica directamente que el concepto pluralizado se compone de elementos del mismo tipo que el original singular (representándose por [C:+G:x]);

    y (ii) se especifica que la pluralización no comporta cambio de tipo -los tipos de la entrada y la salida son el mismo-.

    Esta última especificación da cuenta de la diferencia entre las derivaciones de pluralización y de masificación en el sentido de que, aunque ambas producen conceptos no delimitados, el primero se refiere a más de una instancia del mismo referente original, mientras con el segundo lo referido es un tipo distinto de entidad, que es resultado de algún tipo de elaboración del original.


Fig. VII.8. Regla de Pluralización
 

    De este modo los sintagmas sin determinante de (130a,b) significan acumulación de individuales, mientras que (130c,d) significan -en el sentido considerado aquí- materia derivada del tomate.

    (130)
    a. Había tomates por todas partes
    b. Una caja de tomates
    c. Había tomate por todas partes
    b. Un bote de tomate

    La regla de cumulación (fig. VII.9) es un modelo de la capacidad de construir referencia cumulativa en singular a partir de entidades individuales, como en (131a) o (122a) -repetido en (131b)-:

    (131)
    a. ¿A qué precio está la manzana?
    b. Vendemos tomate barato

    Esta regla se aplicará en general para la construcción de referencia a una pluralidad en singular. Además, puede ser vista como una implementación de la aparente masificación de conceptos denotadores de individuales en construcciones partitivas descrito en §6.1 -ejemplificada mediante 'trozo de silla' en (91)-. Considérense los ejemplos de (132):

    (132)
    a. una rodaja de tomate
    b. rodajas de tomate
    c. mil rodajas de tomate
    d. una rodaja de aquél tomate

    En todos los casos de (132) 'tomate' aparece con la marca habitual de los nombres de masa, la determinación cero. A pesar de ello, no parece haber problema en interpretar 'tomate' en (132a) como una entidad individual. Sin embargo, ello ya no es posible en grupos como el de (132b) -de forma más clara en (132c)-, en donde la pluralización del partitivo sugiere que 'tomate' quizá no pueda referir claramente a un único individual, sino a varios de ellos -de hecho, muchos en (132c), ya que si apurando mucho consiguiéramos dividir un tomate en mil rodajas, no podría llamarse 'rodajas' a las porciones resultantes, sino como máximo 'láminas'-.

    La solución adoptada consiste en considerar que en (132a,b,c), 'tomate' es referido de modo cumulativo, y no discreto.

    Esta reclasificación permite interpretar sin problemas que 'mil rodajas de tomate' es interpretable, como indica el sentido común, como mil rodajas de varios cientos de tomates diferentes. Luego nombres partitivos como 'rodaja' seleccionarían entidades de tipo individual, referidas en modo cumulativo, y expresadas en singular.

    De todos modos, un ejemplo como el de (132d) plantea problemas a esta solución, ya que, aparte de la innegable individualidad del tomate en cuestión, las marcas gramaticales ya no son las habituales de la referencia cumulativa (determinación cero).


Fig. VII.9. Regla de Cumulación
 

    Para finalizar, la regla de generalización (fig. VII.10) refleja la capacidad de construir conceptos genéricos, es decir, conceptos [+D] de tipo clase. (vid. fig. VII.4). Tal y como se define, el sistema impide la generación de formas en plural a partir de conceptos de tipo masa o agregado: (133a) no puede ser sinónimo de (133b) ya que el primero no puede ser interpretado como con referencia a la categoría genérica de vino, sino a subclases de la misma (Riesling, Burdeos...). Esto no ocurre con las entidades de tipo individual: (133c) y (133d), como expresiones genéricas, son sinónimas. Es decir, la generalización mantiene el número gramatical del concepto léxico del que deriva -véanse las derivaciones en las fig. VII.11 a VII.14-.

    (133)
    a. los vinos son buenos para la salud
    b. el vino es bueno para la salud
    c. la manzana es saludable
    d. las manzanas son saludables

    La regla de generalización, además, da cuenta de la estructura interna del concepto genérico. Compárese en la fig. VII.4 y en las fig. de VII.11 a VII.14 los valores del rol CONSTITUTIVO para cada tipo de entidad en el nivel de referencia genérica. En éllas puede verse como la referencia genérica a individuales y grupos está constituída por entidades del mismo tipo (individual y grupo). Y de modo más notable, la referencia genérica a agregados está compuesta de los elementos que integran la estructura interna del agregado. Es decir, mientras en 'la manzana es saludable' estamos hablando de manzanas, en 'la gente es insufrible' estamos hablando de personas, dado que [gente:CONST:persona].


Fig. VII.10. Regla de Generalización
 

    De entre el anterior conjunto de reglas léxicas, las de plural, individuación y masificación son reelaboraciones de las funciones propuestas por Jackendoff (1991) -compárense con las reglas PL, COMP y GR de Jackendoff descritas en §2.2.2-. En las aquí propuestas, además, se da cuenta del número gramatical y se establecen ciertas precisiones que describiré a continuación.

    La regla de plural, como se ha dicho, incorpora respecto a la análoga de Jackendoff el tratamiento del tipo de entidades que componen la estructura interna del concepto pluralizado: el rasgo CONSTITUTIVO da cuenta de que la entidad pluralizada está compuesta de entidades del mismo tipo que la entidad singular originaria, cosa que no se formalizaba en Jackendoff (1991). Así es posible por ejemplo dar cuenta de que los plurales obtenidos a partir de referencia genérica ('vinos', 'ganados') designan conceptos compuestos internamente de múltiples clases -ver fig. VII.8 y compárese con (8a) de §2.2.2-.

    Las reglas de individuación y masificación corresponden, respectivamente, a las funciones COMP y GR de Jackendoff, pero son más restrictivas. Véase en los ejemplos (9) de §2.2.2 cómo la función COMP de Jackendoff es aplicable a cualquier concepto no delimitado, y GR a cualquier concepto delimitado. En cambio la definición dada aquí restringe las especificaciones de entrada, aplicándose ind(ividuación) -equivalente de COMP- únicamente a conceptos no delimitados de tipo masa, y mas(ificación) -equivalente a GR- a conceptos delimitados de tipo individual. Esta restricción evita la aparición de derivaciones no deseadas relativas a grupos y agregados -p.e. [ganado] -> [*un ganado], en el sentido de un animal; o [rebaño] -> [*rebaño] en sentido cumulativo como en '*estuvo pasando rebaño (= múltiples rebaños) toda la tarde'-.

    Nótese finalmente que no utilizo las funciones ELT, PART y CONT de Jackendoff (1991) dado que éstas generan estructuras multiléxicas (construcciones partitivas). El sistema aquí desarrollado da cuenta sólo de la derivación léxica; las construcciones partitivas no las trato como extensiones de significado generadas por regla léxica, sino que se construyen por composición de signos tal y como se ha descrito en §6.
 

7.1.5 Ejemplos de derivaciones

    Las fig. de la VII.11 a la VII.14 son ejemplo de la aplicación encadenada de las reglas léxicas apropiadas partiendo del modo de referencia prototípico para cada tipo de entidad (ver recuadros en trazo grueso en las fig. VII.4 y VII.5). En general, puede verse que, como es deseable, las reglas léxicas, por una parte generan los significados (conjuntos Forma Léxica + Modo de Referencia + Tipo de Entidad) lingüísticamente apropiados; y por otra bloquean la aparición de los que no lo son.

    En primer lugar, en la fig. VII.11, veamos la derivación a partir de individuales. Partiendo de la especificación prototípica de un individual, se pueden aplicar tres reglas léxicas: cum(ulación), pl(ural) y mas(ificación). Nótese que cum y pl originan dos vías de derivación, una en singular y otro en plural, resultando ambas en contenidos semánticos idénticos par las referencias cumulativa y genérica. Este efecto da cuenta de la posibilidad de construir para los individuales ambos modos de referencia (cumulativa y genérica) tanto en singular como en plural -ver (122a,b) y (133c,d), repetidos a continuación en (134):

    (134)
    a. Vendemos tomate barato
    b. Vendemos tomates baratos
    c. la manzana es saludable
    d. las manzanas son saludables

    Además, la pluralización de la referencia genérica en singular da cuenta de la referencia a clases como en (135):

    (135) Los mejores tomates de Catalunya son los pometa i los ramellet

    La otra regla aplicable a un individual es mas, que causa el cambio de tipo del mismo dando lugar a un concepto de masa, como [tomate] (salsa, jugo, etc.). A partir de este punto son aplicables las reglas léxicas apropiadas para cualquier concepto de tipo masa. Es decir, de modo consecutivo, se aplicará primero gen y luego pl, dando lugar a referencias genérica y de clases relativas a la sustancia -equivalentes a (127a,b) y (133a,b)-. Ambos modos de referencia no son muy usuales cuando derivan inicialmente de un individual, especialmente la referencia de subclases, aunque ciertamente es posible una expresión en el contexto de un restaurante como la de (136):

    (136) Puede elegir entre dos tomates: normal o picante


Fig. VII.11. Derivación a partir de Individuales

    Posiblemente expresiones de este tipo tan sólo se darán en contextos muy marcados, pero lo importante para nuestros propósitos es que la posibilidad existe, por lo tanto el sistema la genera.

    Es plausible la hipótesis de que cuanto más derivado sea un concepto, menos probable es que se de en el lenguaje; y que además, si la derivación implica cambios de tipo, la probabilidad sea progresivamente aún menor. Sin embargo esta hipótesis no será explorada aquí. En un desarrollo ulterior del modelo, sería interesante aplicar las ideas de Briscoe y Copestake (1995) -ver capítulo anterior- relativas a asociar información de la probabilidad de aplicación de las reglas léxicas a fin de primar la posibilidad de generación de los sentidos derivados más habituales y limitar la de los menos esperables.


Fig. VII.12. Derivación a partir de Masas
 

    La fig. VII.12 es un ejemplo de las posibilidades de derivación a partir de conceptos prototípicamente de masa. Nótese que en ese caso, al contrario de lo que ocurre con los individuales, el sistema únicamente genera la referencia genérica en singular, quedando las formas plurales para construir bien la referencia clasal bien la pluralidad de dosis individuales. En la figura no se muestra la totalidad de derivaciones hasta el agotamiento de la cadena generativa; p.e., [cerveza] (unidad discreta), siendo como es un concepto de tipo individual, puede seguir siendo derivado como cualquier concepto de dicho tipo -véase fig. VII.11-. Por ejemplo, la aplicación de la regla gen a los conceptos cumulativos que derivan de [cerveza] (individual) dará lugar a un concepto genérico que dará cuenta de expresiones como 'las cervezas son carísimas en Suiza', en dónde 'cervezas' significa [botellas de cerveza] (genérico).

    La fig. VII.13 muestra las derivaciones a partir de grupos. Éstos, al contrario de lo que ocurre con los individuales, no parecen admitir referencias cumulativa y genérica en singular -ver (122g,h) y (128)- dado que no existen reglas para generar dichos modos de referencia partiendo de formas en singular. En otras palabras, se bloquea la aparición de los equivalentes en singular de 'los rebaños son necesarios para la economía' y de 'el prado esta lleno de rebaños', es decir, de construcciones como las de (137):

    (137)
    a.??el rebaño es necesario para la economía
    b. *el prado está lleno de rebaño (=[múltiples rebaños])

    Por su parte, la fig. VII.14 representa la derivación a partir de agregados. Nótese que el sistema bloquea una interpretación individuativa de 'ganado': *'un ganado' con el significado de un único animal doméstico. En consecuencia también se bloquea una ulterior derivación de acumulación de individuales (*ganados = animales). Así el sistema da cuenta de que, con la única excepción de la individuación de masas ([café] -> [un café]), el único modo de individuación que admite la referencia cumulativa es mediante construcciones partitivas.


Fig. VII.13. Derivación a partir de Grupos


Fig. VII.14. Derivación a partir de Agregados
 

    Finalmente, tal y como ocurría con las masas, la referencia genérica en plural también resulta bloqueada (* 'los ganados son necesarios para la economía').
 

7.1.6 Recapitulación

    El sistema que ha presentado permite el tratamiento y la representación formal de diversos aspectos del lenguaje. Desde el punto de vista de la representación del conocimiento da cuenta de la polisemia lógica de las unidades léxicas, es decir, de que las palabras a menudo tienen sentidos que, aunque estén estrechamente relacionados entre sí, son distintos. Estos tipos de polisemia se explican a partir de relaciones merológicas (elemento-multiplicidad, materia-entidad) entre los conceptos. Asimismo, el sistema es un modelo formal de un aspecto de la competencia léxico-semántica de los hablantes de español: la capacidad de comprender y utilizar significados de los lexemas distintos (y derivados) de los que son habituales para los mismos.

    Los efectos lingüísticos más destacados de la generación de conceptos mediante reglas léxicas son los siguientes:

    • Genera referencias genérica ('cerveza') e individual ('una cerveza') a partir de masas, quedando las formas plurales para multiplicidad de individuales ('cervezas') o de clases ('hay dos cervezas en el súper: Heineken y Carlsberg').

    • Genera multiplicidad de individuales en singular ('hay mucho coche hecho polvo por ahí).

    • Genera referencia genérica a individuales tanto en singular como en plural ('el/un cordero es un animal simpático', 'los corderos son animales simpáticos').

    • Deriva interpretaciones de tipo masa a partir de individuales ('están comiendo cordero').

    • Bloquea la aparición de referencia genérica a agregados en plural ('*los ganados son necesarios para la economía').

    • Bloquea la individuación léxica a partir de agregados ('*un ganado)

    Desde el punto de vista de la optimización de la representación léxica en sistemas computacionales, el sistema permite evitar la multiplicidad de entradas, una por sentido de cada lexema, de modo que en el lexicón figurará en principio de modo estático únicamente la entrada básica, generándose los sentidos derivados mediante reglas léxicas.

    Asimismo, diversos aspectos del procesamiento del lenguaje pueden ser abordados utilizando la representación propuesta.

    En primer lugar puede establecerse la combinatoria de los nombres con determinantes y cuantificadores de acuerdo con el tipo de concepto denotado. Por ejemplo, especificadores como 'un', 'dos', 'los', 'aquel', 'aquellos' o 'muchos' combinarán con 'café/s' si significa dosis o subclases, y con 'coche' o 'cordero' si denotan individuales.

    En segundo lugar, permite tratar la relación entre significado y número gramatical, de modo que, p.e., 'café' denotará en singular la sustancia o un individual derivado, y en plural, 'cafés' múltiples individuales o múltiples clases; y 'ganado' en singular nunca podrá denotar entidades individuales.

    En tercer lugar, pueden tratarse de modo unificado tipos diferentes de lexicalización de un mismo significado en lenguas distintas, como en el caso de la equivalencia español-inglés de 'un mueble' a 'a piece of furniture' para designar, en un caso mediante un singular, en el otro mediante una construcción partitiva, un mismo concepto, una entidad individual.

    Finalmente, de modo relacionado, el sistema permitirá dar cuenta de modo homogéneo de las restricciones selectivas de los nombres partitivos, aspecto que trataremos en la siguiente sección.

7.2 Clasificación de los nombres partitivos en función
de sus restricciones selectivas


    El sistema desarrollado en §7.1 permite finalmente llevar a cabo la tarea de clasificación de los partitivos en función de sus restricciones selectivas que dejamos pendiente en §5, clasificación en la que también incluiremos los pronombres. En todo caso deberá tenerse en cuenta que la clasificación refiere a los tipos generales de concepto léxico seleccionado, y que cada partitivo en particular seleccionará subtipos apropiados de los mismos.

    La clasificación, que se muestra en tabla VII.3, define dos grandes grupos: el de los partitivos que seleccionan conceptos no delimitados y el de los que seleccionan conceptos delimitados.

    Dentro del primer grupo (I), dos tipos de partitivos, los Métricos y los Contenedores (I.i), seleccionan conceptos no delimitados en general, sin ulterior especificación; el resto (I.ii, I.iii, I.iv y I.v) seleccionan de modo más preciso un subconjunto de los conceptos no delimitados -con alguna restricción, p.e. de número o tipo-.

    Los del segundo grupo -los partitivos que seleccionan conceptos delimitados, (II)- se subdividen entre los que seleccionan conceptos delimitados granulares (II.i) y los que seleccionan conceptos delimitados no granulares (II.ii), no habiéndose hallado partitivos genéricos respecto a la delimitación del complemento (es decir, que seleccionen conceptos delimitados, independientemente de que sean granulares o no).
 

 

Conceptos seleccionados

Tipo de Partitivo

Ejemplos

I.i

[-D]

Contenedores

botella, cesto, camión

 

[-D]

Métricos

litro, kilo

I.ii

[-D] num: sing

Pronombres cuantificadores de masas

algo, poco

I.iii

[-D +G]

Grupos

grupo, hilera, bandada

I.iv

[-D] tipo: ind num: sing

Porciones

rebanada, lámina

I.v

[-D] tipo: masa granular

Elementos

grano, copo

 

II.i

[+D +G]

Pronombres extractores de elementos

uno, alguno

 

[+D +G]

Nombres partitivos extractores de elementos

miembro, elemento

II.ii

[+D -G]

Nombres de límites 

punta, superficie

Tabla VII.3: Clasificación de los partitivos
 

    En primer lugar, los contenedores y los métricos (I.i) seleccionan conceptos [-D], es decir, entidades de tipo masa (138a,f), de tipo agregado (138c,h), y plurales no determinados, tanto compuestos de individuales prototípicos (138b,g), como reclasificados de masa a individual (138d), como denotando repertorio de subclases (138e).

    (138)
    a. una botella de vino
    b. un cesto de naranjas
    c. un camión de ganado
    d. una caja de cervezas
    e. una caja de vinos
    f. un litro de vino
    g. un kilo de naranjas
    h. un kilómetro cuadrado de bosque

    Dentro de la clase general de partitivos que seleccionan conceptos no delimitados encontramos, aparte de los antes mencionados, cuatro clases que seleccionan estructuras más especificadas.

    En primer lugar, los pronombres cuantificadores de masas (I.ii) seleccionan conceptos no delimitados en singular, o sea masas y agregados, como en (139):

    (139)
    a. Un poco de pan
    b. Algo de gente

    Ya en el campo de los nombres, en segundo lugar los partitivos de grupos (I.iii) seleccionan conceptos [-D+G], es decir, agregados y plurales no determinados, como en los ejemplos de (140):

    (140)
    a. Un grupo de gente
    b. Una hilera de casas

    En tercer lugar, los partitivos de porción (I.iv) seleccionan conceptos no delimitados, en singular y de tipo subyacente individual. Esta última especificación impide el troceado de nombres de líquidos o gases ('*un trozo de agua', '*un pedazo de freón') dando cuenta de que, en el campo de las entidades físicas, el lenguaje únicamente permite denotar porciones de entidades sólidas, como en (141). Sin embargo, distintas razones, aducidas en los capítulos anteriores, han sugerido que en este tipo de construcciones se da un proceso representable como una reclasificación a masa de las entidades individuales que hace posible, de hecho implica, que la entidad de la que se extrae la porción aparezca con las marcas gramaticales de la referencia cumulativa (o de los nombres de tipo masa). Dicha reclasificación se ha expresado en §6.2 de modo infraespecificado en el rol CONSTITUTIVO de la estructura de qualia, y en términos de LKB, en §7.1 mediante reglas léxicas. En todo caso, la hipótesis que se representa es que las porciones individuan a partir de entidades de tipo individual en modo de referencia cumulativo.

    (141)
    a. Una rebanada de pan
    b. Una lámina de acero
    c. Un lingote de oro
    d. Un trozo de silla

    Dentro de este tipo cabrá distinguir distintos subtipos atendiendo a ulteriores especificaciones de tipo FORMAL y AGENTIVO. En cuanto al primer caso, algunos partitivos denotan una forma de la porción, bien de modo holístico (141c), bien respecto a alguna de sus dimensiones (141b); y algunos de tipo genérico no expresan forma (141d). Respecto al segundo caso, algunos indican forma de obtención -como en (141a), en dónde la porción se ha obtenido por corte de la entidad original- mientras que otros la indican. Estos aspectos provocarán una subespecificación del tipo general porción en tipos particulares tales como formas ('lingote', 'lámina'), fragmentos ('trozo', 'fragmento') o divisiones ('rodaja', 'rebanada').

    Finalmente (I.v), tenemos los partitivos que seleccionan conceptos [-D] de tipo masa, con la especificación de que se trata de masas granulares, como 'arroz' o 'nieve', es decir, masas para cuyos elementos, posiblemente por ser de tamaño suficiente como para ser perceptibles por los sentidos, el lenguaje tiene nombre ('grano', 'copo') -p.e. (142)-.

    (142)
    a. Un copo de nieve
    b. Un grano de arroz
    c. Un grano de trigo, por no llamarte Rodrigo

    Como segundo gran grupo (II) hallamos los partitivos que seleccionan conceptos delimitados, subdividido en los que seleccionan conceptos granulares, nombres y pronombres extractores de elementos de una multiplicidad (II.i), y los que seleccionan conceptos no granulares, los nombres partitivos de límites y partes topológicas (II.ii).

    Los del primer tipo (II.i) seleccionan nombres de grupos y plurales determinados (luego delimitados), como en (143):

    (143)
    a. Uno del equipo
    b. Alguno de los jugadores
    c. Un miembro del comité

    Los del segundo (II.ii) responden al esquema parte_de -a diferencia de la totalidad de los partitivos anterirormente relacionados, que pertenecen a uno de los dos esquemas materia-entidad o elemento-multiplicidad-, y como se ha dicho, corresponden a nombres de partes topológicas de las entidades delimitadas, como en los ejemplos de (144):

    (144)
    a. El centro de la tierra
    b. La punta de la lengua
    c. La base de la pirámide
    d. El lóbulo de la oreja

7.3 Consideraciones finales


    El sistema de representación y construcción de modos de referencia presentado en este capítulo pretende ser un modelo de la capacidad de los hablantes de atribuir a un mismo lexema significados diferentes por lo que atañe a su capacidad referencial; es decir, en definitiva, de atribuirle un diferente contenido semántico. En el modelo, los distintos conceptos léxicos (tripletas forma léxica - tipo de entidad - modo de referencia) derivan, para cada tipo de entidad de una especificación semántica básica considerada prototípica para dicho tipo.

    En §7.1 he presentado el fenómeno de las alternancias de modo de referencia y he desarrollado el marco de representación del significado asociado a las mismas mediante estructuras de rasgos tipificadas de LRL-LKB, basadas parcialmente en la teoría del Lexicón Generativo de Pustejovsky (1991, 1995) y en la Semántica Conceptual de Jackendoff (1991). Para ello, he definido formalmente la representación del significado básico o prototípico para cada tipo de entidad -en consonancia con la noción de lexicalización inicial de Langacker (1991)-, y he desarrollado un sistema de reglas léxicas que genera los conceptos derivados adecuados a partir de cada tipo.

    El modelo presenta de modo formal una faceta fundamental de la polisemia lógica de los nombres que implica la existencia de relaciones parte-todo entre conceptos distintos expresados por un mismo lexema, y sirve de base para definir de modo adecuado la combinatoria de los mismos con especificadores o elementos análogos a fin de construir unidades complejas con significados completos. De modo particular, lo que constituía mi propósito fundamental en este capítulo, da cuenta de las posibilidades combinatorias de los nombres de entidades con partitivos a fin de expresar partes, cantidades relativas o porciones de un todo. De este modo, como se ha expuesto en §7.2, finalmente ha sido posible clasificar los nombres y pronombres partitivos de acuerdo con sus restricciones de selección.

 8. Conclusiones generales


    En este trabajo he tratado desde varias perspectivas el problema de la representación del conocimiento parte-todo y su reflejo en el lenguaje, con el propósito final de conseguir un tratamiento unificado y aplicable, si no a todos, sí al mayor número posible de facetas que el mismo presenta.

    Como se ha puesto de manifiesto a lo largo del trabajo, el conocimiento que tienen los hablantes de la relación que se establece entre un todo y aquéllo de lo que se concibe que está compuesto, es un conocimiento de uso continuo y generalizado en la comunicación lingüística. Además, según se desprende de diversos trabajos en el campo de la lingüística cognitiva, dicho conocimiento parece jugar un papel fundamental en la construcción de las categorías mentales que, en último término, en tanto que compartidas o interpretables de modo convencional en una comunidad, hacen posible la comunicación entre sus miembros mediante el lenguaje.

    En consonancia con lo anterior, la obtención de una representación formal de dicho conocimiento resulta de trascendental importancia para cualquier aplicación de ingeniería lingüística que lleve a cabo algún tipo de tratamiento y representación del significado.

    En muchos estudios lingüísticos es habitual confundir el conocimiento parte-todo con la meronimia, lo que, paradójicamente, no deja de ser una metonimia consistente en tomar una parte por el todo. Como hemos visto, se entiende por meronimia aquella relación estructural que se establece en el léxico entre lexemas que denotan, respectivamente, las partes y el todo de una misma entidad. Indudablemente, éste es un aspecto muy importante del fenómeno, pero sólo uno.

    Por una parte, es un hecho que no únicamente utilizamos términos lexicalizados para referirnos a entidades que son una parte o una agrupación de otras entidades, también utilizamos sintagmas, por ejemplo sintagmas partitivos. Por otra, es asimismo notorio que, al menos en español, usando un mismo lexema se expresan conceptos distintos entre los que se establece una relación parte-todo; como ejemplo típico, piénsese en la pluralización: sobre la base del mismo lexema se puede expresar tanto una unidad de algo, como un concepto que refiere a una multiplicidad de tales unidades. En ese caso, entre el concepto discreto y el concepto múltiple se establece una relación de colectivo a miembro perfectamente análogo al que se establece, por ejemplo, entre un banco de salmonetes y un salmonete en particular.

    Además, el conocimiento relativo a la composición de una entidad o concepto, no únicamente se tiene por lo que refiere a entidades múltiples. Los hablantes también tienen conocimiento de que las entidades simples están hechas de algún tipo de material o sustancia y, naturalmente, el lenguaje tiene mecanismos para expresarlo, a veces mediante palabras distintas, a veces mediante una misma palabra con diferentes denotaciones.

    Por éstas y otras razones he partido de la hipótesis cognitivista de que las relaciones parte-todo no pueden ser vistas meramente como un caso de relación estructural entre las palabras del léxico, sino que deben ser abordadas desde una concepción del significado en tanto que relaciones que se establecen entre categorías y estructuras mentales, que están sujetas a diversos grados de lexicalización.

    En consecuencia con lo anterior, me he basado en los planteamientos teóricos del Lexicón Generativo y la Semántica Conceptual, y he utilizado para la formalización el lenguaje de representación LRL-LKB, ya que permiten representar de forma unificada un modelo del conocimiento semántico asociado a las expresiones del lenguaje, sean éstas palabras o sintagmas, así como combinarlas entre sí para obtener expresiones más complejas -con su correspondiente representación semántica-.

    En la búsqueda de un único tratamiento generalizado para los múltiples aspectos de la expresión lingüística del conocimiento merológico, ha jugado un papel importante la definición de tres únicos esquemas fundamentales que permiten dar cuenta de todo tipo de relaciones parte-todo entre conceptos. Los esquemas componente-entidad, materia-entidad y elemento-multiplicidad subsumen anteriores clasificaciones de relaciones parte-todo y constituyen un marco simple y adecuado para la integración de otras aproximaciones al problema -como por ejemplo la de Jackendoff-, y para el desarrollo de mi propia empresa.

    Desde el punto de vista de la representación formal en el marco de la teoría del Lexicón Generativo, ha resultado asimismo necesario -al estar únicamente sugerido en la obra de Pustejovsky-, el desarrollo de la definición del papel y el contenido del ROL CONSTITUTIVO de la ESTRUCTURA DE QUALIA.

    Solventada la representación del conocimiento meronímico mediante la aplicación de los tres esquemas básicos antes citados a un lexicón organizado de modo jerárquico, he desarrollado un tratamiento de otros aspectos más complejos del problema, en especial la representación de las construcciones partitivas, pero también la alternancia léxica materia-entidad y la relación entre la pluralización y la expresión de la multiplicidad.

    El uso de construcciones partitivas es un mecanismo del que dispone el castellano para individuar, es decir, para referirse a áreas del mundo de referencia en tanto que entidades delimitadas y diferenciadas. En ese sentido su capacidad de denotación es equivalente a la de muchos otros nombres y sintagmas nominales; por ello, las representaciones semánticas que he desarrollado a los grupos partitivos son, deben ser, análogas a las de los nombres predicativos. Por ejemplo, las relaciones parte-todo que las construcciones partitivas establecen, se describen, como en el caso de los nombres, mediante los tres esquemas merológicos básicos que se han propuesto. Pero, tratándose los grupos partitivos de expresiones complejas, y por tanto compuestas, ha sido preciso definir cuál es el contenido semántico de sus partes -en especial, del nombre partitivo-, y de qué modo deben combinar éstas para dar lugar a la representación adecuada para el sintagma.

    A partir del hecho de que la individuación es un mecanismo del que deben disponer todas las lenguas para hacer posible la comunicación, hemos observado como lenguas estructuradas de modo distinto al español utilizan otro tipo de recursos para individuar. De modo específico, hemos visto como muchas lenguas disponen para ello de los denominados clasificadores. La comparación de éstos con los nombres partitivos del castellano han confirmado la sugerencia de Lyons (1977) de que ambos realizan funciones análogas. Además, el análisis de la tipificación de los clasificadores llevada a cabo por Allan (1977) ha permitido, por analogía, describir gran parte del contenido semántico de los nombres partitivos, que se concreta especialmente en aspectos formales (forma, disposición, magnitud), de función o de origen de la entidad a denotar, aspectos todos ellos directamente representables en el marco de la teoría del Lexicón Generativo.

    Utilizando las representaciones y mecanismos previstos en dicha teoría, he desarrollado los métodos de composición de los nombres partitivos con los sintagmas nominales que funcionan sintácticamente como núcleo de su complemento, de modo que se obtenga la representación semántica apropiada para el grupo partitivo completo.

    Hemos destacado dos aspectos primordiales de dicho proceso compositivo. En primer lugar, el de la naturaleza relacional de los nombres partitivos, que por una parte implica la necesariedad de obtener del contexto la representación semántica del argumento relacionado (denotador del todo de referencia, a partir del cual se obtiene la parte denotada por la construcción partitiva); y por otra implica que los nombres partitivos están sujetos a restricciones de selección, de acuerdo con el tipo semántico del argumento con el que pueden combinar.

    El segundo aspecto a destacar es que, a diferencia de lo que ocurre con el resto de sintagmas nominales, en los sintagmas partitivos la composición no se fundamenta de forma directa en el contenido semántico del núcleo sintáctico. Por el contrario, en la composición de las construcciones partitivas, núcleo y complemento (partitivo y todo de referencia), contribuyen conjuntamente y de modo equilibrado a la constitución del contenido informativo resultante.

    Las representaciones desarrolladas dan cuenta de ambos aspectos, en en primer caso mediante la definición de una estructura argumental para los partitivos; y en el segundo mediante la utilización del mecanismo de co-composición previsto en la teoría del Lexicón Generativo -realizado mediante correferencia o reentracia de rasgos en la estructura de los signos-.

    Para la descripción de los mecanismos compositivos he tomado como caso ejemplar el de los grupos partitivos que denotan trozos, porciones o segmentos de entidades. Y dentro de ellos, he partido de la asunción tradicional de que en dichas construcciones el partitivo selecciona argumentos de tipo masa.

    Partiendo del anterior presupuesto he mostrado como, no sólo las construcciones de este tipo en que el complemento denota una masa o substancia, sino también aquéllas en que el complemento denota una entidad individual, pueden ser tratadas de forma que se obtenga, por co-composición, la representación semántica adecuada para el grupo partitivo. Ello ha sido posible por la aplicación de un tratamiento formal que refleja el hecho de que los hablantes tienen conocimiento de que toda entidad individual está hecha de algún tipo de materia o sustancia. La representación de dicho conocimiento ha sido en gran parte posible a partir del desarrollo del papel del ROL CONSTITUTIVO de la ESTRUCTURA DE QUALIA de los signos como medio de codificación de las relaciones merológicas fundamentales, así como, en algunos casos, a partir de la descripción de los signos mediante tipos complejos, tal como prevé la teoría del Lexicón Generativo.

    El desarrollo de la descripción formal de los nombres partitivos y de los mecanismos de composición semántica de las construcciones partitivas, no ha constituido en todo caso un objetivo en sí mismo, sino también una etapa necesaria para dar cuenta de aspectos anteriormente no tratados de la problemática general de la combinatoria de los signos.

    En concreto, el anterior aparato teórico ha permitido dar solución a problemas que surgen en el proceso de combinatoria de los verbos con sus argumentos, cuando estos últimos están expresados mediante construcciones partitivas. De modo específico, he dado cuenta de los casos en que las restricciones selectivas del verbo se ven satisfechas por el argumento atendiendo a propiedades del todo a partir del cual se ha obtenido la porción (como en 'comer un trozo de pan'); de los casos en que la selección depende en último término de propiedades intrínsecas de la porción (y denotadas por el partitivo, como en 'doblar una lámina de acero'); y de los casos en que el argumento satisface dichas restricciones en función de ciertas propiedades subyacentes a la entidad que denota (como en 'terminar el último capítulo de una tesis', expresión para la que se obtiene la representación deseable, equivalente a la de 'terminar de escribir -o de leer- el último capítulo de una tesis').

    Continuando con el problema de las restricciones selectivas de los predicados, la descripción de las de los propios partitivos plantea un buen número de dificultades, dada la aparente heterogeneidad de los argumentos con los que pueden combinar. La necesidad de ofrecer una clasificación coherente de los partitivos de acuerdo con sus restricciones de selección nos ha llevado a abordar un problema de semántica léxica de ámbito mucho más general que, no de forma casual, afecta a varios aspectos del conocimiento parte-todo asociado a los nombres: la polisemia lógica o polimorfismo.

    Aparte de constatar que una misma entidad puede ser referida mediante nombres distintos con tipos semánticos -y en consecuencia implicaciones sintácticas- diferentes ('un traje', 'ropa', 'un conjunto de chaqueta y pantalón'), hemos visto cómo un mismo lexema puede ser utilizado para referirse a entidades distintas, aunque íntimamente relacionadas entre sí ('café', 'cafés', 'un café'). Esta capacidad de moldeado semántico de las unidades léxicas que permite el español está relacionado, por una parte, con la posibilidad de diversos modos de referencia a entidades; y por otra, con el conocimiento relativo a la propia composición interna de las mismas.

    Por supuesto, tales observaciones no constituyen una novedad en el campo de la semántica léxica, aunque quizá sí la comprensión de que todas ellas son múltiples facetas de un único fenómeno, para el que es posible dar una descripción global y un marco general de representación.

    Para ello he utilizado diversas fuentes teóricas, como la distinción entre referencia discreta y cumulativa debida a Bunt (1981), la noción de lexicalización inicial apuntada por Langacker (1987, 1991) y las funciones conceptuales desarrolladas por Jackendoff (1991) -aparte de mis propias consideraciones relativas a la relación entre la expresión de la multiplicidad y el número gramatical, la formalización de las expresiones genéricas y de la referencia a múltiples clases, la extensión de las intuiciones de los autores citados hasta cubrir casos no tratados anteriormente, y la posibilidad de describir todo el entramado mediante un conjunto de reglas léxicas a partir de especificaciones formales consideradas como prototípicas-.

    El tratamiento da cuenta de otros modos de expresión del conocimiento parte-todo, cual es la realización léxica de alternancias dentro de los esquemas materia-entidad y elemento-multiplicidad (contando en este último caso la pluralización simple, la expresión de la pluralidad en singular, y la pluralización para denotar clases de entidades); y es un modelo formal de la competencia de los hablantes de español a dicho respecto.

    Además, finalmente, la descripción de los conceptos léxicos que se ha utilizado para desarrollar el modelo, ha permitido ofrecer una clasificación coherente de los partitivos atendiendo al tipo general de concepto que seleccionan.

    Con todo ello, he intentado presentar un análisis global y un tratamiento formal unificado de los múltiples aspectos que presenta la expresión del conocimiento parte-todo en español.
 

 9. Líneas de trabajo futuras


    Muchos de los temas que he planteado a lo largo de este trabajo merecen ser desarrollados con mayor profundidad y detalle. De entre todos ellos, considero especialmente interesantes los que apuntaré a continuación.

    En general, he tratado el tema basándome en el caso de los nombres que denotan entidades concretas y tangibles. La elección no ha sido gratuita, sino que sigue las líneas apuntadas por Cruse (1986) y la corriente cognitivista (p.e. Lakoff, 1987) en el sentido de que éstos constituyen los casos centrales, alrededor de los cuales se construye la mayor parte del conocimiento semántico y a partir de los que, por analogía o extensión, se estructura el significado relativo a las entidades abstractas.

    De modo más preciso, Lakoff defiende la hipótesis de que la extensión metafórica es el mecanismo fundamental de conceptualización y de estructuración del pensamiento abstracto, mediante el cual los hablantes son capaces de comprender y tratar el mundo no físico en términos de aquello que es directamente perceptible por los sentidos. Sin duda, como hemos sugerido mediante varios ejemplos a lo largo del trabajo, este modo de entender la estructuración del significado incluye el uso de relaciones y esquemas merológicos, y el empleo de construcciones partitivas (recuérdese: 'una gota de ironía', 'la base de mi argumentación').

    En mi opinión, un tratamiento completo de la expresión lingüística del conocimiento parte-todo precisa de un análisis detallado en ese sentido y una representación formal de este tipo de conocimiento. En cuanto a este último punto, como he manifestado anteriormente, creo que los mecanismos que he presentado aquí, posiblemente desarrollados en algunos aspectos en el sentido apuntado por Jackendoff (1991) respecto al cálculo dimensional (ver §2.2.2), pueden ser aplicados sin necesidad de modificaciones sustanciales.

    Siguiendo con las hipótesis de la lingüística cognitiva, otra línea de trabajo, muy directamente relacionada con la anterior y que considero digna de mayor atención que la que le he prestado aquí es la del uso de términos antropomórficos para la construcción de sintagmas partitivos. Argumenta Lakoff que gran parte de la elaboración y comprensión del significado lingüístico, no únicamente se basa en la extensión a terrenos abstractos del conocimiento relativo al mundo físico, sino que, de modo más preciso, se fundamenta en la experimentación del propio cuerpo: de su estructuración, sus propiedades y sus funciones. En relación directa con dicha hipótesis, hemos visto en (4) de §2 algunos ejemplos del uso como partitivos de nombres de partes del cuerpo ('la boca del metro', 'la cara de la moneda', 'una mano de póker'). Al parecer, este tipo de construcciones pueden ser halladas en todas las lenguas, lo que añade un interés especial al tema ya que no únicamente proporciona un punto de vista muy atractivo para el análisis y la descripción lingüística, sino que permite abordar el tratamiento de un posible universal semántico.

    Por supuesto, como habrá podido comprobar quien haya tenido la paciencia de leerla, las anteriores no son ni mucho menos las únicas cuestiones que han quedado por tratar en esta tesis. Los temas que he apuntado aquí, la extensión metafórica y el antropomorfismo, son sólo dos caminos que personalmente me resultan atractivos y que me apetecería, si me es posible, explorar en el futuro.

Articulos relacionados:
Tipología amatoria: Cruce fantástico entre: "El diablo enamorado" de Jacques Cazotte y "La muerta enamorada" de Théofile Gautier
Resumen:
Las siguientes líneas tienen por objeto llevar a cabo un análisis comparado entre el cuento “la muerta enamorada” de Théofile Gautier y la novela El diablo enamorado de J...
El poder de la fantasía y la literatura infantil
Resumen:
La palabra fantasía viene del griego phantasia, que significa facultad mental para imaginarse cosas inexistentes y proceso mediante el cual se producen con imágenes los ...
Santiago Dabove, esa feroz criatura que atraveso el relampago
Resumen:
Un eterno retorno aparencial -admitamos, por un momento esta imagen, de la que Santiago Dabove descreía-, nos lleva a la curiosa y nunca saciada tesis de Paul Valéry: La ...
El porvenir de España
Resumen:
Unamuno y Ganivet: cuatro cartas abiertas, publicadas en El Defensor de Granada en 1898.
De Nabo a los ángeles: un escritor, un relato y muchos tiempos. Para una visión de las mudas temporales
Resumen:
Se intenta demostrar que el magistral uso que hace el escritor Gabriel García Márquez de las técnicas narrativas, especialmente de las mudas temporales, en el cuento Nabo...
Copyright © 2011 ilustrados.com, Monografias, tesis, bibliografias, educacion. Tofos los temas y publicaciones son propiedad de sus respectivos autores ©