164 21
Português Pages 527 [528] Year 1992
1
Teoria da Gramática. A Faculdade
J
Q ss O tT
JJf
Nascido em Lisboa em 1949, Eduardo Paiva Raposo foi um dos membros fundadores do GELT (Grupo de Estudos de Linguística Teórica), que introduziu e divulgou a teoria da gramática generativa em Portugal. Em 1973 entrou como Assistente na Faculdade de Letras de Lisboa, de pois de aí ter completado a licenciatura em Filologia Românica. Estudou igualmente na Universidade da Califórnia em San Diego e no MIT. Em 1982 doutorou-se em Linguística Portuguesa pela Universidade de Lisboa, onde passou a leccionar como Professor Auxiliar. É autor do livro Intro dução à Gramática Generativa e de vários artigos sobre sintaxe do Portu guês em revistas da especialidade como Linguistic Inquiry e Natural Language and Linguistic Theory. Vive na Califórnia desde 1984, sendo actualmente Professor Associado no Departamento de Espanhol e Português da Universidade da Califórnia em Santa Bárbara.
Teoria da Gramática. A Faculdade da Linguagem E duardo Paiva R aposo
CAMINHO colecção universitária série LINGUÍSTICA dirigida por Maria Raquel Delgado Martins
|
À memória de Luís Filipe Lindley Cintra, Professor e Amigo
AQUISIÇAü DOAÇÃO DOADO POR______________
1 8 JUK. 2001 R E G IS T R O ^ M p L ^ S ' £ DATADOREGISTRO IV. L ÚG [ ■
TEORIA DA GRAMÁTICA. A FACULDADE DA LINGUAGEM Autor: Eduardo Paiva Raposo Capa e orientação gráfica: Secção Gráfica da Editorial Caminho Revisão: Secção de Revisão da Editorial Caminho © Editorial Caminho, SA, Lisboa — 1992 Tiragem: 2000 exemplares Composição: Secção de Composição da Editorial Caminho Impressão e acabamento: Tipografia Lousanense Data de impressão: Abril de 1992 Depósito legal n.°ól 150/92 ISBN 972-21-0713-5
111 cm ooo 6•í
objectos dc um determinado conjunto», neste caso particular as frases dc uma língua ("). Em síntese, o estudo da competência enquanto puro sistema de conhecimentos mental implica que o linguista proceda a uma abstracção das diversas variáveis em jogo nos actos de fala concretos, ou seja, implica que o objecto do seu estudo seja «um falante-ouvinte ideal, situado numa comunidade linguística completamente homogênea, que conhece a sua língua perfeitamente, e que, ao aplicar o seu conhecimento da língua numa per formance efectiva, não é afectado por condições gramaticaimente irrelevan tes tais como limitações de memória, distracções, desvios de atenção e in teresse, e erros (casuais ou característicos)». (Chomsky (1965, 3), citado da tradução portuguesa, p. 83.) (12)
6. A realização física do sistema da com petência Enquanto sistema mental, a língua tem necessariamente um suporte material no cérebro humano. A questão (4) tem a ver com a relação língua-cérebro, em particular com os mecanismos neuronais que suportam o co nhecimento gramatical. Pouco teremos aqui a dizer sobre esta área da in vestigação, a qual, se bem que esteja ainda numa fase prematura, tem sido objecto de esforços renovados no âmbito do interesse crescente pelas ciên cias da cognição em geral. Estes estudos, escusado será dizê-lo, terão de pôr em jogo uma colaboração estreita entre linguistas, psicólogos, patolo gistas da fala e neurologistas, os quais, com base em resultados pelo menos parciais obtidos pelos linguistas relativamente às questões (l)-(3), poderão investigar os mecanismos físicos específicos que estão na base dos diver sos sistemas da competência e da performance. Uma área privilegiada nesta investigação é o estudo das afasias, em particular o estudo do modo se-
(") Chomsky (1988a) coloca igualmente entre as questões de (3) o problema da pro dução da linguagem, que considera no entanto o seu aspecto mais misterioso e sobre o qual o pensamento científico pouco ou nada tem a dizer. Entre os problemas levantados pela produção encontram-se o uso criativo e inovador da linguagem, isto é, a possibili dade de pronunciarmos pensamentos que nunca exprimimos ou ouvimos anteriormente, a liberdade da linguagem relativamente a estímulos externos ou internos (por exemplo, se tenho fome, não digo necessariamente tenho fome!), e a sua adequação (salvo casos pa tológicos) às situações discursivas. Critérios deste tipo eram frequentemente adiantados pelos Cartesianos para a postulação da noção de «mente», oposta à noção de «corpo» como autômato. Para uma discussão das confusões metodológicas e conceptuais que a distinção competência/performance tem suscitado na linguística contemporânea, ver Newmeyer (1983).
33
■ toctivo com o
o conhecimento gramatical é afectudo por tipos diferentes de IcvBes cerebrais (•'). A possibilidade dc sucesso teórico na caracterização ncuronul detalha d a do sistema gramatical levanta a questão do estatuto epistemológico dos conceitos utilizados pelo linguista na caracterização desse sistema, em particular, se estes conceitos devem ou não ser substituídos pelos do neu rologista no momento em que este seja capaz de oferecer uma caracteriza ção igualmente detalhada e profunda em termos de células, neurônios, etc. A questão mais geral que se coloca é a de saber se o estudo da mente — entendida como um conjunto de sistemas cognitivos — deve ou não ser reduzido ao estudo do cérebro no momento em que os neurologistas tiverem um conhecimento completo do modo como os sistemas físicos su portam os vários sistemas mentais. Com o o assinala Chomsky (1988a) (e outros cientistas da cognição relativamente aos seus domínios particulares), é pouco provável que a com preensão dos fenômenos linguísticos possa ser atingida sem referência a noções especificamente gramaticais como Frase, Grupo Nominal, Grupo Verbal, pronome, anáfora, ligação, etc. O mesmo se passa, de um modo mais geral, relativamente aos restantes sistemas cognitivos da mente hu mana. Os dois tipos de estudos — da mente e do cérebro — sem dúvida que se complementam, mas situam-se em planos diferentes da realidade, sem que nenhum se possa reduzir ao outro. A mente, nesta perspectiva, é o conjunto das propriedades abstractas dos sistemas físicos do cérebro, e a com preensão destas propriedades passa necessariamente pelo uso de con ceitos (em particular o conceito de representação) independente dos me canism os m ateriais postulados ao nível do cérebro.
7. À questão da aquisição da linguagem Como mencionámos acima, a questão central do programa de investi gação da gramática generativa é sem dúvida (2), ou seja, o problema de saber como é que a gramática se desenvolve na mente do suj^TfdTaráhte. e em que b a sè r Por òutias palavras, é a questão da aquisição da lingua gem , que foi, e continua a ser, uma das questões mais debatidas na história
C13) A investigação das relações língua-cérebro tem antecedentes importantes (que rem ontam ao século xix) no estudo das localizações cerebrais de aspectos diferenciados da linguagem (por Broca e Wemicke, entre outros). Broca foi o primeiro a apresentar evidência experimental de que a língua se situa dominantemente no hemisfério esquerdo do cérebro.
34
do pensamento filosófico e linguístico ocidental (integrada ou não no âm bito mais vasto do debate epistemológico sobre a aquisição do conhecimen to cm geral) (M). O problema central nesta questão é o do papel específico da mente humana neste processo. De um lado situam-se aqueles que acreditam ser o desenvolvimento linguístico (e a aquisição do conhecimento em geral) basicamente determinado por causas externas à mente humana, concreta mente pelas experiências e interacções da criança com o meio ambiente. No caso da linguagem, o meio ambiente é representado pela fala das pes soas que convivem com a criança, e pelas interacções linguísticas em que a criança intervém. Segundo os defensores desta posição, a linguagem é essencialmente uma questão de aprendizagem, no sentido específico de aqui sição pela mente, através de práticas adequadas, de um sistema exterior a ela. Segundo o psicólogo B. F. Skinner, por exemplo, a aquisição de uma língua consiste fundamentalmente numa aprendizagem de hábitos de «com portamento verbal» através de processos de observação, memorização, ge neralização indutiva, associação, etc. Esta posição, por outro lado, realça o papel do ensino explícito e da prática como sendo essencial tanto na im plantação como na solidificação dos conhecimentos adquiridos. Finalmente, o papel da mente humana em todo este processo é diminuto Quando muito, a mente possui princípios de inteligência extremamente gerais, que supor tam a capacidade de efectuar generalizações e associações (na área da lin guagem | do conhecimento em geral), mas não existem princípios ou es truturas especificamente dirigidos para a aprendizagem das línguas. Diferentes versões desta posição têm sido defendidas ao longo da história do pensamento epistemológico (filosófico e científico) ocidental, constituin do aquilo a que é usual chamar a tradição empirista (da filosofia, psicolo gia ou linguística). Na psicologia do século XX, estas idéias foram defen didas explicitamente pelo behaviorismo Norte-Americano e, relativamente à aquisição da linguagem, especificamente por Skinner (1957). Para a tradição racionalista, na qual Chomsky se inscreve (e da qual é sem dúvida o expoente máximo na psicologia e na linguística do século XX), a mente humana desempenha um papel fundamental na aquisição da linguagem. Segundo esta perspectiva, as propriedades centrais da linguagem são determinadas por princípios e estruturas mentais de conteúdo es pecificamente linguístico, às quais Funcionam como uina espécie de «planta» arquitectónica no processo de aquisição, dirigindo o desenvolvimento
(M) Sobre os tópicos desenvolvidos nesta e nas seguintes secções, ver, entre outros, Baker (1979), Gleitman e Wanner (1982), Chomsky (1965, 1972; 1986b; 1988a; 1988b), Cook (1988), Aitchison (1989) e Lightfoot (1989). 35
linguístico num sentido predeterm inado. Estas estruturas mentais pertencem exciusivainente à espécie humana e s ã o geneticamente determinadas, ou seja, radicam na organização biológica da espécie. Segundo esta concepção, ad q u irir uma língua é mais uma questão de m atum ção e de desenvolvimen to de um «órgão» mental biológico do que uma questão de aprendizagem (no sentido que explicitám os atrás). A este conjunto de princípios e estru turas m entais especificam ente linguísticos, Chomsky (1966b) chama M e canism o de Aquisição da Linguagem (em Inglês, «Language Acquisition Device», usualm ente abreviado em «LAD»). Nos modelos linguísticos pro postos pelos generativistas, o LAD recebe o nome de «Gramática Univer sal» (abreviam os em UG, do Inglês «Universal Grammar»). A concepção racionalista não nega o papel do meio ambiente na aqui sição da linguagem . Em prim eiro lugar, a fala das pessoas que rodeiam a criança e as suas experiências verbais são determ inantes para iniciar o fun cionam ento do m ecanism o de aquisição, sem no entanto determinar as propriedades finais atingidas pelo sistema gramatical. Ou seja, sem estar im ersa num am biente linguístico, um a criança não aprende a falar (l5). Em segundo lugar, os m eios linguístico, em ocional e educativo são factores que determ inam o grau d e desenvolvim ento da linguagem pela criança sem que isso signifique, de novo, que determinam a direcção do desenvolvimento ou o conteúdo final do sistema (16).
(*5) Não é só o meio ambiente linguístico que é determinante no desenvolvimento da linguagem (ou no desenvolvimento das outras capacidades intelectuais de uma crian ça): o equilíbrio, a estabilidade emocional e a saúde física são condições ambientais tão importantes como a interacção verbal. Estes truísmos têm sido infelizmente confirmados pelas crianças mantidas em isolamento durante os primeiros anos da sua vida. Para um dos casos mais bem estudados no âmbito da psicologia e da linguística moderna (o caso de Genie), ver Curtiss (1977). O6) Chomsky (1988b, 502) dá como exemplo o crescimento de uma flor, um pro cesso sem dúvida geneticamente determinado. O desenvolvimento final atingido pela flor depende crucialmente dos cuidados com que é tratada, embora estes não possam alterar o curso específico do crescimento ou o seu resultado final no que respeita às características particulares da espécie (por exemplo, se plantarmos a semente de uma rosa não obtemos um cravo). Estas observações têm consequências importantes relativamente à elaboração de currículos escolares apropriados para o desenvolvimento da linguagem nas crianças (pre ferimos o termo «desenvolvimento» ao termo «aprendizagem» pelos motivos apontados no texto). Os ataques feitos à gramática generativa de uma perspectiva pedagógica atri buindo-lhe a ideia de que as capacidades linguísticas se desenvolvem «por si mesmas» e não necessitam de cuidados escolares (ou outros) revela ignorância ou desonestidade. No extremo oposto, a ideia de que o desenvolvimento das capacidades linguísticas da crian ça passa pela aprendizagem da teoria gramatical, em particular de uma pseudogramática generativa reduzida a uma análise das expressões em árvores, representa uma posição de 36
Existe um aspecto, no entanto, em que o «meio ambiente» linguístico determina de um modo óbvio o conteúdo parcial daquilo que é aprendido: se uma criança cresce numa comunidade linguística em que se fale o Japonês, por exemplo, a língua que aprende é o Japonês e não o Português. Volta mos mais à frente (aquando da discussão da noção de parâmetro) a esta observação trivial mas tão importante na determinação das características exactas do modelo de aquisição subjacente ao desenvolvimento da lingua gem.
8. O problem a da projecção O problema da aquisição da linguagem pode ser teoricamente coloca do do seguinte modo: qual é a relação que existe entre os «dados primários» ... a que a criança tem acesso durante a fase de aquisição da linguagem (o seu meio ambiente linguístico) e jjjsis le n já jte x o n ^ im e n to s final que ca racteriza a competência linguística do adulto_(incluindo os seus juízos de gramaticalidade e as suas intuições fonoíógicas, sintácticas e semânticas)? Baker (1979) chama a esta questão o «problema da projecção» na medi da em que implica uma projecção. quantitativa., e qualitativa, dos dados primários (necessariamente finitos e consistindo em expressões relativamente simples) sobre o conjunto infinito de expressões da língua. Isto significa que a criança adquire a partir de uma experiência finita um sistema de com petência que se aplica sobre um conjunto infinito de expressões e que in corpora propriedades complexas (nomeadamente recursivas, ver o capítulo 2.5.) que os dados primários certamente não exigem. Em resumo, o siste ma da competência final (a gramática do adulto) é quantitativa e qualitati vamente muito mais complexo do que o sistema simples necessário para caracterizar os dados primários a partir dos quais o sistema final é adqui rido. Colocado nestes termos, o problema da aquisição leva logicamente à conclusão de que existe um mecanismo mental inato de aquisição que medeia
efeitos absolutamente nefastos e revela uma incompreensão total tanto dos fundamentos básicos da gramática generativa como do processo de aquisição e desenvolvimento da linguagem pela criança. Tal como uma flor, uma criança precisa de um meio ambiente i rico que lhe permita desenvolver ao máximo as suas potencialidades linguísticas (isto é, 1precisa de leitura, de conversação, de prática da escrita, etc.). A última coisa que a crian ça necessita é que lhe ensinem a estrutura da sua língua. Essa estrutura, ela própria enjiicarrega-se de a desenvolver sem necessidade de instrução, e de um modo muito mais rico, 1sofisticado e articulado do que aquilo que é proposto por qualquer teoria linguística actual, incluindo a TRL.
entre os dados primários e a gramática final, e que procede à projecçflo quantitativa e qualitativa que caracteriza o sistema final. Em síntese, u gramática final (o sistema da competência) é o resultado da interucção entre os dados primários e o mecanismo mental de aquisição. A resolução do/ problema da projecçáo consiste pois em determinar tão precisamente quan to possível as responsabilidades respectivas do mecanismo de aquisição e i dos dados primários no processo de aquisição e desenvolvimento do siste-j ma final da competência do sujeito falante. Nos termos deste modelo, a tradição empirista pressupõe (pelo menos implicitamente) que a relação entre os dados primários e a competência final do falante é relativamente directa, e que não existem diferenças notáveis de natureza qualitativa entre os dois. Para desenvolver o sistema de co nhecimentos final a partir dos dados primários, apenas são necessários princípios mentais indutivos simples como a capacidade de estabelecer analogias entre diferentes expressões ou paradigmas e de proceder a gene ralizações de vária ordem com base nessas analogias (n). Para além des tes processos mentais, a aquisição da linguagem é uma questão de treino, imitação e memorização por parte da criança, e de coiTecção, aprovação ou reprovação por parte dos pais ou das pessoas responsáveis pela sua educação. 1| Chomsky tem apontado várias vezes que este modelo é irrealista por que ignora (ou nega) o abismo não só quantitativo, mas essencialmente qualitativo, que existe entre os dados linguísticos primários e o sistema de conhecimentos final do adulto, a sua gramática interiorizada. Chomsky nota que o indivíduo falante possui toda uma série de conhecimentos sobre a sua língua cujo desenvolvimento não pode provir da aplicação de meca nismos indutivos de generalização sobre os dados primários, e muito menos por imitação ou memorização. Nos termos de Chomsky, os estímulos primários são «pobres», isto é, não contêm a informação necessária para explicar o sistema rico e complexo de conhecimentos finais (através de ge neralizações, imitações, etc.). Em textos recentes (ver, por exemplo (1986b; 1988a)), Chomsky' refere-se a esta situação como sendo um dos casos particulares daquilo a que chama o «problema de Platão»: concretamente, o problema de saber como é que um adulto possui um sistema de conhe-
(17) Um exemplo simples de generalização analógica é o seguinte: com base na observação de que um número finito de verbos cujo infinitivo termina em -ar forma o pretérito imperfeito com a terminação -va, o falante conclui que qualquer verbo cujo infinitivo termine em -ar forma o pretérito imperfeito com aquele sufixo. Em sintaxe, no entanto, exemplos simples de generalizações são muito mais difíceis, se não mesmo impossíveis, de construir.
38
cimcntos específico tão complexo e tão rico sobre a sua língua (e outros sistemas mentais, sem dúvida) dada a pobreza dos estímulos iniciais aos quais é exposto durante a fase de aquisição. Os estímulos iniciais são pobres porque não contêm as informações pertinentes para o desenvolvimento das propriedades específicas do sistema final. A solução para o problema de Platão, segundo Chomsky, só pode ser uma: se os dados primários são insuficientes para explicar o sistema de conhecimentos final, então é necessário concluir que a mente da criança põe | sua disposição um conjunto de princípios linguísticos complexos (o LAD, ou, do ponto de vista do linguista, UG) que guia de um modo predeterminado e extremamente restringido a aquisição e desenvolvimento da linguagem. A este argumento em favor de um sistema UG inato, Choms ky chama o «argumento da pobreza dos estímulos». Em síntese, o falante adulto tem determinados conhecimentos sobre a sua língua para os quais não existe evidência (linguística, psicológica, ou de qualquer outro tipo) que possam ser determinados directamente pelo meio ambiente linguístico inicial durante o curso normal do processo da aquisição, com ou sem a aplicação de mecanismos de associação, generalização, etc. Estes conheci mentos têm pois de ser atribuídos à «planta arquitectônica» inata que guia e determina a aquisição e desenvolvimento da linguagem.
9.
O s dad o s p rim ários e a não existên cia de in fo rm ação n egativa no p ro cesso de aquisição
Alguns estudos recentes sobre a natureza dos dados primários e o seu papel na aquisição e desenvolvimento da linguagem apoiam a tese de Choms ky sobre a pobreza dos estímulos iniciais e a necessidade de postular um mecanismo mental inato de aquisição. Estes estudos mostram que o meio ambiente linguístico de uma crian ça típica durante a fase de aquisição é essencialmente formado por expres sões gramaticais da língua, e que é com base nesta informação positiva que a criança desenvolve uma gramática interiorizada (18). Por outro lado, H | A questão de saber se os dados primários contêm igualmente expressões «dege neradas» e semigramaticais é objecto de debates na literatura psico-linguística. Note-se que nesse caso o problema da projecção é ainda mais complicado para a criança. Outra questão debatida é a de saber se os dados primários consistem essencialmente numa fala simplificada e estruturada de modo apropriado às capacidades psico-linguísticas das crian ças em cada etapa do seu desenvolvimento (o termo inglês para esta fala é «motherése»). Para uma síntese de várias posições sobre este problema (nomeadamente a ideia de que este tipo de fala não é pertinente para a aquisição), ver Gleitman e Wanner (1982) e Newmeyer (1983). 39
«quilo a que os psicólogos c os linguistas chamam informação negativa, «tu seja. informação sobre as expressões inaceitáveis da língua, desempe» nha um papel nulo ou diminuto no processo de aquisição: as crianças tipicamente nfio recebem instrução gramatical, quer sob a forma de correcçâo de erros quer sob a forma de explicações explícitas (ver Baker (1979), Cook (1988), Lightfoot (1989) e os trabalhos sobre psicologia do desen volvimento da linguagem aí citados) (,9). Como Lightfoot (1989) o assi nala. a criança não é um «pequeno linguista» construindo a sua gramática com base simultaneamente em informações sobre expressões gramaticais e não gramaticais C20). Uma das questões mais prementes postas pelo problema da aquisição é então a de explicar como é que o sistema final inclui o conhecimento de que determinadas expressões ou frases são inaceitáveis, ou seja, como é que a criança desenvolve o conhecimento essencialmente negativo de que tal ou tal expressão não existe na sua língua ou não pode ter uma deter minada significação a priori logicamente possível. O problema pode ser sucintamente caracterizado do seguinte modo: a partir de informação uni camente positiva a criança desenvolve toda uma série de conhecimentos negativos sobre a língua. Quais são então os mecanismos de aquisição que permitem este processo? O modelo empirista de aquisição não parece ter instrumentos suficientes para responder a esta questão: não se entende bem como é que a generalização analógica permite a construção de um conhe cimento negativo a partir de informação unicamente positiva (ver a secção seguinte para alguns exemplos concretos). Para o modelo racionalista, pelo contrário, este tipo de processo não é problemático, reforçando a conclu são de Chomsky de que os estímulos iniciais da criança são «pobres», e de que apenas um mecanismo inato suficientemente complexo pode expli car a aquisição e desenvolvimento da linguagem (2I).
( ,9) A correcção pelos pais, por exemplo, ainda que ocorra durante o processo de apren dizagem, tende mais a ser sobre a adequação do conteúdo da fala das crianças relativa mente à situação discursiva, e menos sobre a forma gramatical das expressões. Em qualquer caso, a correcção parece não ter um efeito decisivo sobre o rumo do processo de apren dizagem (muitas vezes a criança corrigida pura e simplesmente ignora as correcções e continua sistematicamente a fazer o mesmo erro, até à altura própria, biológica, de in corporar a forma ou as formas correctas). H Nem os dados primários da criança se encontram organizados em paradigmas cla ros e arrumados como os do linguista, isto é, predirigidos para a formação de hipóteses científicas. C21) Cook (1988) mostra igualmente que os dados primários têm de obedecer a uma exigência de uniformidade. Por exemplo, se a correcção pelos pais parece predominante no processo de aprendizagem de algumas crianças, mas é totalmente inexistente no caso de outras crianças, e se ambos os grupos adquirem aproximadamente a mesma compe40
e x e m p lo (1 0 ), p e lo c o n trá rio , a su a in te rp re ta ç ã o é p rim a ria m e n te « a rb itrária » :
(9)
Nesta penitenciária, os presos agridem-re frequentemente.
(10) Nesta penitenciária, agridem-se os presos frequentemente. Abstraindo das expressões adverbiais nesta penitenciária e frequen temente, o exemplo (9) recebe primariamente a interpretação anafórica recíproca «para cada par {x, y} do conjunto dos presos, x agride y (po dendo x=y)» (a interpretação reflexiva «cada membro x do conjunto dos presos agride x» embora gramaticalmente possível, é pragmaticamente menos normal); e o exemplo (10) recebe a interpretação «um conjunto de pessoas indeterminadas (alguém) agride os presos», em que o pronome se corres ponde ao sujeito da oração, ou seja, ao Agente da acção de agredir, como o NP os guardas na expressão nesta penitenciária, os guardas agridem os presos frequentemente). Se chamarmos a sua atenção para esse facto, os falantes do Português tência linguística final, então a aquisição não pode depender da conecção de um modo crucial. A questão mais geral levantada pela exigência de uniformidade é o facto de as crianças de uma dada comunidade linguística desenvolverem sistemas finais de compe tência linguística muito semelhantes quanto ao seu escopo e qualidade, mau grado terem experiências iniciais diferentes no domínio não só linguístico, mas também social, edu cativo, emocional e cultural (ver Chomsky (1965) para uma primeira discussão deste problema). Citamos uma passagem de Cook (1988,61) que nos parece ser uma das melhores sínteses sobre a questão: «So long as the environment contains a certain amount of language, it appears not to be crucial to the acquisition of grammatical competence what this sample consists of; any human child leams any human language, whatever the situation.» 41
reconhecem (embora talvez de um modo não tão imediato) que a forma sv em (9) pode possuir igualmente uma referência indeterminada «arbitrária», sendo a expressão nesse caso parafraseável por «quanto aos presos, alguém os agride frequentemente nesta penitenciária», em que de novo se corres ponde ao sujeito (ao Agente) da oração (22). Contudo, nenhum falante do Português aceita para (9) a interpretação apresentada em (11), com a forma se indeterminada correspondendo ao objecto directo: (11)
Nesta penitenciária, os presos agridem pessoas indeterminadas (alguém) frequentemente (os guardas, por exemplo).
Esta interpretação, no entanto, seria perfeitamente normal do ponto de vista da consistência semântica, lógica e pragmática (isto é, não seria difícil imaginar uma situação que tomasse a interpretação (11) adequada para (9)). A sua completa impossibilidade significa que a gramática interiorizada dos falantes do Português contém princípios formais independentes da semân tica e da pragmática que permitem a referência «arbitrária» para se no caso de esta forma corresponder ao sujeito da oração (ao Agente), mas não no caso de corresponder ao objecto directo, como em (9) (apenas a interpre tação anafórica é então possível). Esta propriedade da gramática interiorizada dos falantes do Português não se desenvolve certamente com base nos dados primários aos quais estes são expostos enquanto crianças, durante o período de aquisição da lingua gem. Muitas crianças provavelmente não são nunca expostas a frases com se impessoal durante este período, e mesmo que o sejam não recebem nor malmente instrução sobre a interpretação, em particular que o seu uso impessoal é excluído quando se corresponde a um objecto directo (o que
C2) Esta interpretação é facilitada fazendo uma pausa entre o NP os presos e o ver bo. Devidamente instados, os falantes do Português aceitam igualmente para (10) uma interpretação recíproca «para cada par {x, y) do conjunto dos presos, x agride y». Esta interpretação, no entanto, é de certo modo marginal quanto à sua aceitabilidade. No universo discursivo introduzido pelo exemplo (10), a «referência» de se pode ser estabelecida pragmalicamente (é «normal», por exemplo, que sejam os guardas que agri dem os presos), algo que é irrelevante para o argumento que desenvolvemos no texto. Repare-se que são sempre possíveis outras referências para se, de acordo com a sua inleqjretação gramaticalmente «arbitrária». Em (10), o verbo concorda em pessoa e número com o NP os presos, o que faz com que este exemplo seja minimamente diferente de (9). Certos falantes poderão preferir a interpretação arbitrária com o verbo no singular (nesta penitenciária, agride-se os p re sos frequentem ente), o que é igualmente irrelevante para o argumento que desenvolve m os no texto.
42
constituiría um caso de informação negativa). Esta informação não é mcncionada (explícita ou implicitamente) em manuais de gramática escolar e muito menos por pais, assistentes de infância ou professores de educação primária. Por outro lado, não se vê bem como é que o mecanismo empirista de generalização por analogia pode estar na base da impossibilidade da inter pretação (11) para a frase (9). Na realidade, uma aplicação plausível deste mecanismo leva neste caso a predições inconrectas. Existe sem dúvida uma analogia de significado entre o pronome se «arbitrário» e o pronome al guém, como referimos acima. Plausivelmente, as crianças adquirem um co nhecimento (pelo menos passivo) do pronome alguém antes de adquirirem o uso impessoal, «arbitrário», de se. Segundo os esquemas de aprendiza gem propostos pelos empiristas, esta analogia deveria então levar a crian ça a derivar a gramaticalidade de (13b) com uma interpretação sinônima de (12b) através de uma generalização baseada na analogia entre (12a) e (13a) e na gramaticalidade de (12b): (12) a. Nesta penitenciária, alguém agride os presos frequentemente, b. Nesta penitenciária, os presos agridem alguém frequentemente. (13) a. Nesta penitenciária, agridem-se os presos frequentemente, b. I Nesta penitenciária, os presos agridem-se frequentemente. A impossibilidade de (13b) com a significação de (12b) mostra que a noção de analogia é de facto irrelevante para a aquisição do sistema de conhecimentos que o falante possui sobre a função impessoal da forma se. Este conhecimento não parece ser pois derivado, nem directamente nem atra vés de generalizações indutivas, a partir dos dados primários a que as crianças são expostas durante a aquisição. Como esse conhecimento faz no entanto indubitavelmente parte do sistema linguístico dos adultos, temos de con cluir que é derivado a partir de princípios linguísticos inatos pertencentes ao mecanismo mental de aquisição da linguagem, princípios esses inde pendentes dos dados primários da aquisição f23). Consideremos agora o uso anafórico do pronome se (ver os capítulos 8 e 15 para uma exposição detalhada dos princípios em jogo). Nesta função, se exige a presença na mesma oração de um NP independente do qual possa retirar o seu valor referencial (na terminologia da linguística, um antece dente). Em (14), se tem como antecedente o NP as actrizes (nas expres-
(M) Ver Burzio (a publicar) para uma proposta concreta relativa aos princípios que estão na base da impossibilidade de (13b) com a significação de (12b).
•ÍWr* que *>c seguem, o NP em avaliação como antecedente potencial de *e etxxmtra-se em itálico): (14) As actrizes insultaram-se. Nas expressões de (15), no entanto, se não pode tomar como antecedente o NP as actrizes: (15)
a. * As amigas dos actrizes insultaram-se. b. * As actrizes disseram que se tinham insultado as amigas antes da cerimônia de atribuição dos óscares. c. * As actrizes disseram que as amigas se tinham insultado.
A expressão (15a) não pode significar que as amigas das actrizes insulta ram as actrizes, tendo apenas a interpretação em que se toma como ante cedente o NP completo as amigas das actrizes. A expressão (15b) não pode significar que as actrizes tinham dito que elas, actrizes, tinham in sultado as amigas: nessa expressão, se pode unicamente (um tanto ou quanto marginalmente) tomar como antecedente o NP as amigas. Finalmente, (15c) não pode significar que as actrizes tinham dito que as amigas as tinham insultado a elas, actrizes. Tal como em (15b), são as amigas que se insul tam a si próprias. De novo, as noções empiristas sobre a aquisição parecem ser de pou ca utilidade na explicação deste conjunto de intuições semânticas. Nenhu ma criança recebe treino sobre os valores referenciais possíveis ou im possíveis para se em expressões como (15). Mais especificamente ainda, nenhuma criança (ou adulto) comete erros semânticos relativamente a fra ses como (15), atribuindo-lhes uma interpretação impossível a se para ser depois corrigida pelos pais ou professores. Na realidade, a complexidade dos factos neste caso realça ainda mais a implausibilidade de qualquer ins trução. Por exemplo, nenhuma noção simples de proximidade linear entre se e o seu antecedente é suficiente para caracterizar os factos, como uma inspecção rápida de (15a) mostra (as actrizes é o NP linearmente mais próximo de se e no entanto não pode ser o seu antecedente). Também aqui, lemos de concluir que são princípios inatos da Gramática Universal que estão em jogo na determinação das interpretações possíveis do uso anafórico da forma se (para uma explicação destes factos, ver os capítulos 8 e 15). Para terminar este conjunto de aplicações (simplificadas) do argumen to da pobreza dos estímulos, consideremos de novo a forma se na sua in terpretação impessoal. Nas línguas Românicas em que o sujeito pronomi nal pode ser nulo (como o Português, o Espanhol e o Italiano), se impes soal pode ocorrer em orações simples ou em orações subordinadas, desde 44
que os verbo* respectivo* pertençam a uma das conjugações do indicativo ou do conjunttvo: (16) a. Telefonou-,*/? ao João. b. Ele disse [que se tinha telefonado ao João]. c. Ele quer (que te telefone ao João]. Em Espanhol e em Italiano, se impessoal não pode ocorrer numa oração em que o verbo seja infinitivo: (17) a. * E necessário [telefonam a Giovanni] (Italiano). b. * Es necesario [telefonearse a Juan] (Espanhol). Uma vez mais, não é plausível manto- que estas distinções estão presen tes nos dados primários das crianças que adquirem o Espanhol ou o Ita liano, sob a forma de instrução negativa explícita ou de correcção por parte de outros falantes. Mas mais perturbante para as teorias empiristas da aquisição é o facto de em Português a expressão correspondente a (17) ser gramatical: (18) É necessário [telefonar-se ao João]. Neste caso, não só é implausível, mas pura e simplesmente absurdo, manter que os pais italianos e espanhóis treinam sistematicamente os seus filhos de modo a não aceitar (17), ao passo que os pais portugueses treinam os seus filhos de modo a aceitar (18). Existe uma diferença entre o Italiano e o Espanhol, por um lado, e o Português, por outro, que pode ser relacionada com a diferença de gramaticalidade entre (17) e (18). O Português, contrariamente às outras duas línguas, possui uma conjugação de «infinitivo flexionado», ou «pessoal», a qual consiste na forma do infinitivo simples modificada por sufixos de concordância em pessoa e número (ver, entre outros, Cunha e Cintra (1984), Mateus et al. (1989) e, na perspectiva da TRL, Raposo (1987a); ver tam bém o capítulo 7.1). Podemos assim propor a hipótese de que em (18) es tamos na realidade face ao infinitivo flexionado na terceira pessoa do sin gular (uma forma idêntica à do infinitivo simples), e que é este infinitivo que «licencia» o pronome se. A ser correcta, esta hipótese coloca a seguinte questão relativamente à aprendizagem: como é que a criança infere a gramaticalidade de (18) da existência na sua língua de uma conjugação de infinitivo flexionado? Dados primários a que é exposta não trazem consigo nenhuma indicação milagro sa nesse sentido, em particular porque em (18) a concordância não se 45
nutnifcstu morfologicamcnte. Por outro lado, essa conexão não o objccto de nenhuma instrução por parte de pais, professores ou manuais de grumáticu. De novo a conexão é (indirectamente) estabelecida pelo mecanismo inato de aquisição da linguagem, a partir de uma cadeia causai de princípios que determ inam uma ligação necessária entre a forma se impessoal e a con cordância verbal, através da noção de «Caso Abstraeto» (24). Km síntese, uma teoria empirista da aquisição da linguagem, defenden do que a com petência linguística do falante adulto é adquirida directamente a partir do «meio ambiente», através de instrução, memorização, formação de hábitos e aplicação de mecanismos de generalização indutiva, é inade quada para dar conta do carácter extremamente rico e complexo do co nhecim ento final adquirido. Em particular, é incapaz, na esmagadora m aio ria dos casos, de apresentar uma conexão linguisticamente plausível entre os dados primários e a natureza específica do conhecimento final, como vimos pela análise (breve) de vários aspectos do comportamento sintáctico da form a se. A única conclusão plausível é de que a mente possui um «plano arquitectónico» para a construção do sistema de conhecimentos linguísticos final, o qual opera de um modo altamente específico na base de dados prim ários limitados, guiando de um modo quase rígido o desenvolvimen to de certas estruturas e proibindo outras (por vezes através de cadeias causais com plexas e não triviais, e que compete à investigação gramatical desco brir). As estruturas permitidas, por sua vez, determinam os juízos de gramaticalidade e as intuições do falante adulto sobre a sua língua.
11. A G ra m á tic a U niversal A teoria do linguista sobre o estado inicial do mecanismo de aquisi ção da linguagem é a Gramática Universal (UG), entendida como a soma dos princípios linguísticos geneticamente determinados, específicos à espé cie hum ana e uniformes através da espécie f25). Podemos conceber a Gram ática Universal como um órgão biológico, que evolui no indivíduo í24) Para a noção de Caso Abstraeto, ver o capítulo 12. Para uma análise da forma impessoal se em Italiano onde se mostra a sua dependência relativamente a essa noção, ver Burzio (1986) e Cinque (1989) (que contém igualmente uma análise do contraste entre paradigmas semelhantes a (17) e frases semelhantes a (18) em Português). (2S) A especificidade de UG à espécie humana é hoje em dia incontroversa mau grado as tentativas (falhadas) de atribuir sistemas comparáveis a macacos, abelhas ou golfi nhos (para uma síntese recente destas tentativas, ver Aitchinson (1989, capítulo 3)). A uniformidade de UG através da espécie humana constitui certamente a hipótese nula e é consistente com os resultados da investigação gramatical bem como das investigações no dom ínio da psico-linguística.
46
como qualquer outro órgão, O resultado dessa evolução é a gramática final que caracteriza os conhecimentos linguísticos do falante adulto. Nos ter mos de Chomsky, a Gramática Universal é o estado inicial da faculdade da linguagem (So), e a gramática do indivíduo adulto constitui o seu esta do final, firme ou estável (Ss, do Inglês «Steady State»), Em qualquer fenômeno gramatical minimamente complexo, as proprie dades da Gramática Universal desempenham um papel fundamenta] na de terminação (logo, na explicação) das propriedades da gramática finai, como concluímos na secção anterior através de alguns exemplos ilustrativos do argumento da pobreza dos estímulos. O estudo da natureza e das proprie dades exactas da Gramática Universal é pois o objectivo central do em preendimento generativista. Nesta secção, apresentamos em primeiro lugar os problemas gerais que se colocam a uma teoria adequada da Gramática Universal. Em seguida, apre sentamos uma análise esquemática da organização geral dos modelos de Gramática Universal que se sucederam na história da gramática generativa. O modelo recente desenvolvido no âmbito da TRL (o modelo de «princípios e parâmetros») é apresentado na secção 12 f26).
11.1. Tensão entre descrição e explicação na Gramática Universal O problema central que se coloca na construção de uma Gramática Uni versal adequada é o de conciliar a diversidade das b'nguas com o caminho rígido e altamente específico tomado pelo desenvolvimento das gramáticas individuais na base de dados primários limitados. A Gramática Universal tem de ser suficientemente flexível para acomodar a variação entre as di ferentes línguas, mas tem ao mesmo tempo de possuir a rigidez necessária para explicar as propriedades altamente específicas que caracterizam o co nhecimento final dos falantes (do tipo observado na secção anterior). A diversidade linguística leva naturalmente os linguistas a multiplicar os mecanismos descritivos da gramática, sem preocupação com o estabe lecimento de princípios que os restrinjam. Contudo, para explicar a natu reza específica do conhecimento final, toma-se necessário restringir esses mecanismos através de princípios universais, diminuindo assim drasticamente o número de gramáticas que podem ser derivadas do sistema inicial. Qualquer dos fenômenos apresentados na secção anterior ilustra este
(J6) Sobre a história da gramática generativa e das causas que levaram à formação, desenvolvimento e abandono dos modelos de UG que antecederam a TRL, ver Newmeyer (1980). 47
| /
ponto Por exemplo, podemos dcixur ao critério das gramáticas particula res a tarefa de especificar os antecedentes possíveis para a forma st* muifóricn, sem qualquer menção mais geral do fenômeno na Gramática Universal. Se a nossa preocupação é descrever, c não explicar, é possível construir uma gramática na qual (14) e todas as expressões de (15) são gramaticais, outra gramática na qual apenas (15a) é gramatical, outra em que (14) c (15b) é gramatical, e assim sucessivamente (í7). Nesta perspectiva, a gramática do Português é aquela em que (acidentalmente) (14) é gramatical, mas as ex pressões de (15) não o são. Todas as outras gramáticas são no entanto possíveis, e uma tal teoria faz a predição de que podem existir tantas línguas diferentes quantas as combinações possíveis de gramaticalidade/não gramaticalidade para (14) e (15a,b,c). Nesta perspectiva, no entanto, é um mistério absoluto o facto de estas com binações arbitrárias de expressões não ocorrerem nas línguas humanas, e de a interpretação das anáforas ser na realidade altamente restringida (como em Português) e não ter a sua fonte em nenhum tipo de instrução explícita. Para explicar a natureza altamente específica do sistema de conhecimentos final, tem os pois de atribuir a UG restrições tais que a única gramática perm itida seja aquela que admite (14) mas admite (15) (na interpretação referida) f28). Ao construir uma UG assim restringida, o linguista diminui as suas propriedades descritivas: assim, nenhuma das gramáticas acima indicadas (com excepção daquela que admite (14) mas exclui (15)) poderá ser derivada, ou descrita, a partir dessa UG. N a m edida em que UG representa as propriedades biologicamente de term inadas do sistema inicial de aquisição da linguagem, ao propor uma tal UG, o linguista faz a previsão extremamente forte de que nenhuma gram ática humana permitirá frases do tipo de (15). Em Islandês, no en tanto, expressões semelhantes a (15c), com a anáfora reflexiva sig, são gram aticais. Assim, em (19), sig pode tomar como antecedente o NP Jó n (exem plo de M anzini e Wexler (1987)): (19)
Jón segir ad Maria elski sig. Jón diz que Maria ame (conjuntivo) Refl
C27) Tem os em m ente a interpretação impossível das expressões de (15) em que o
NP as actrizes é o antecedente da forma se. C28) V er no entanto a discussão sobre o exemplo (19). Essas restrições incidem sobre as possibilidades interpretativas da forma se, em particular sobre a relação estrutural que existe entre se e o seu antecedente. Ver o capítulo 8 para uma discussão da natureza dessas restrições. Recordemo-nos igualmente que dada a pobreza inicial dos estímulos, o siste ma de conhecim entos final do falante sobre (14) e (15) não pode provir do meio linguístico
ambiente. 48
Pace a estes dados, o linguista terá de reconsiderar as propriedades que atribuiu à Gramática Universal de modo a que esta permita uma aná/iora com as propriedades de sig, mas sem perder de vista que em muitas línguas (como o Português) as propriedades das anáforas são consideravelmente mais restritivas. Isto é, o linguista terá de apresentar uma visão mais flexível de UG (aumentando minimamente a sua capacidade descritiva, de modo a permitir o desenvolvimento de gramáticas em que expressões como (19) são possíveis), mas sem sacrificar a sua capacidade explicativa f29). Esta tensão entre descrição e explicação tem caracterizado a grande maioria dos trabalhos realizados nos últimos anos em gramática generativa, e constitui certamente um dos seus aspectos mais interessantes. Em síntese, restringindo UG, diminuímos as suas capacidades descriti vas, possibilitando a explicação da natureza altamente restritiva das gramáticas finais e o facto de muitas das suas propriedades serem adquiridas sem instrução explícita, correcção de erros ou explicação gramatical. Relaxan do UG, por outro lado, acomodamos a variação linguística mas corremos • 0 risco de perder a sua capacidade explicativa. A arte reside pois em chegar 1 um equilíbrio exacto entre estes dois pólos, ou seja, a um sistema ao mesmo tempo suficientemente flexível para permitir a variação linguística j mas suficientemente restringido para explicar a rigidez final do sistema de J conhecimentos adquiridos. |
11.2. A Teoria Standard
à
\A
\fj
-
ri
A primeira fase da gramática generativa foi essencialmente descritivista. Tratava-se então de aplicar a noção nova de «regra transformacional» aos dados linguísticos, e a riqueza e diversidade dos dados que iam sendo progressivamente analisados levava à multiplicação e relaxamento dos mecanismos descritixos, sem tentativas significativas de restringir o^enorme numero, de gramáticas que,a teoria permitia. A preocupação com os pro blemas de aprendizagem existia a um nível teórico, mas não se traduzia na prática concreta dos linguistas através de análises que procurassem explicar como é que os fenômenos em consideração poderíam ser adquiridos, ou seja, que restrições específicas seria necessário impor sobre a Gramática h Universal para explicar a sua aquisição. A teoria da Gramática Universal desta fase da gramática generativa é
(29) Um modelo de UG com as propriedades necessárias para resolver o problema específico da variação de comportamento das anáforas reflexivas é proposto por Manzini e Wexler (1987). 49
conhecida sob o nome de Teoria Standard e recebe u sua formulação mais explícita e desenvolvida em Chomsky (1965) ('°). A Teoria Standard é umu teoria de regras gramaticais, na medida em que concebe as gramáticas essencialmente como sistemas de regras, funcionando de uma certa manei ra e mantendo entre si um número restrito de interacções possíveis. A hipótese central desta teoria é de que as línguas humanas utilizam I dois tipos de regras: as regras de reescrita categoria] e as regras transformacionais. Estas regras organizam-se em componentes e aplicam-se do seguinte modo: as regras de reescrita derivam a «estrutura profunda» das frases; sobre esta aplicam-se em sucessão as regras transformacionais até se chegar à «estrutura de superfície», considerada um reflexo praticamente directo da manifestação auditiva concreta das frases. O formato a que essas regras obedeciam (especialmente no caso das í regras transformacionais) era extremamente flexível, sendo possível cons truir regras capazes de descrever qualquer fenômeno imaginável, mesmo | aqueles cuja plausibilidade de ocorrência em qualquer língua humana seV r ia nulo. Por exemplo, não existem línguas com frases formadas através da aplicação de uma regra transformacional que movimente uma preposi ção em qualquer posição frásica para o início da oração principal. Assim, em nenhuma língua é possível derivar uma sequência como sem o João saiu a c a rte ira através de uma regra que mova a preposição sem para o início da oração a partir de uma expressão como o João saiu sem a carteira. O modelo de UG da Teoria Standard, no entanto, não continha nenhum mecanismo universal que impedisse a formulação de uma tal regra. Na pers pectiva do modelo Standard, portanto, a inexistência de uma tal regra na gramática de qualquer língua humana era um puro acidente. Podemos sintetizar esta situação dizendo que tal teoria tinha um poder expressivo demasiado elevado. As regras propostas nesta fase são também extremamente especializa das: os generativistas descrevem separadamente, e de um modo relativa m ente atomisla, as construções individuais (como a passiva, as interrogati vas, as relativas, as pseudoclivadas, etc.), sem procurar estabelecer as propriedades gerais ou as condições comuns a que estas pudessem obede cer C31)- Para além disso, as diferenças encontradas de língua para língua
y || Ainda que a Teoria Standard não fosse suficientemente restritiva como base de uma teoria plausível da aquisição, é em Chomsky (1965) que o programa racionalista da gramática generativa relativamente ao problema da aquisição recebe uma das suas for mulações mais explícitas. No que respeita aos elementos centrais deste programa, não é fácil encontrar nos trabalhos mais recentes de Chomsky algo que não tenha já sido dito em Aspectos. f31) A própria noção de «construção gramatical», por sua vez, era directamente her-
50
em cada construção individual motivavam quase sempre a elaboração de descrições gramaticais independentes e autônomas, uma vez mais sem pro curar estabelecer de modo sistemático se os fenômenos tinham algo em comum. Devido à sua enorme riqueza descritiva, um modelo deste tipo permi tia a construção de gramáticas diferentes compatíveis com um mesmo conjunto de dados linguísticos. Para decidir em última instância qual des tas gramáticas é correcta, a Teoria Standard continha uma medida de ava liação destinada a determinar uma classificação dessas gramáticas, sendo a gramática com classificação mais elevada mantida, e as restantes rejeita das. Um dos critérios propostos para a avaliação das gramáticas consistia numa medida numérica de simplicidade segundo a qual a gramática cor recta era a mais «curta», isto é, aquela fazendo uso de um número menor de símbolos (ver Chomsky (1965, 37-47) para uma das poucas discussões detalhadas sobre a medida de avaliação). Na perspectiva deste modelo, a criança é, durante a fase de aquisição, um «pequeno cientista» construindo hipóteses sobre as regras da sua língua que sejam compatíveis com os dados gramaticais a que vai sendo progres sivamente exposta, e eliminando aquelas que se revelam incompatíveis com dados novos. Se num dado momento dois sistemas de regras se revelam igualmente compatíveis com os dados, a criança utiliza a medida de ava liação, descartando-se do sistema mais complexo. L- O pendor acentuadamente descritivista deste modelo, o facto de per mitir uma incrível variedade de gramáticas, o seu enorme poder expressi vo e o insucesso em construir uma medida de avaliação psicológica e linguisticamente plausível contam-se entre os factores que determinaram, por volta de finais dos anos 60, uma insatisfação mais ou menos generalizada da parte de linguistas e psicólogos com a Teoria Standard, em última instância o seu abandono, e o desenvolvimento subsequente de um mode lo alternativo, a Teoria Standard Alargada (32).
dada da gramática tradicional, servindo de base não questionada para a aplicação dos novos mecanismos formais. É apenas em Chomsky (1970) que assistimos ao começo da dife renciação entre as construções tradicionais e as regras transformacionais, com a ideia de que a construção passiva é objecto de duas regras transformacionais independentes na sua formulação e aplicação (a «anteposição do objecto» e a «posposição do Agente»), (32) Ver Baker (1979) para algumas críticas específicas ao modelo de Aspectos do ponto de vista de uma teoria da aquisição. Nesta breve síntese histórica ignoramos o de senvolvimento, nos últimos anos da década de 60, da chamada Semântica Generativa, uma 51
11.3. A T eoria Standard Alargada A partir da segunda metade da década de 60, c especialmenle durante os anos 70, a redução da capacidade descritiva e do poder expressivo da teoria e o aumento da sua capacidade explicativa constituiu a preocupação central de Chomsky e dos generativistas que partilhavam as suus concep ções sobre a linguagem humana. Uma das estratégias para atingir este objectivo consistiu em retirar da formulação das regras particulares aque les aspectos que podiam ser convertidos em princípios gerais da lingua gem. e atribuí-los à Gramática Universal. Um dos primeiros exemplos desta estratégia é a dissertação de doutoramento de John R. Ross, Constraints : on Variables in Syntax (Ross (1967)), a qual descreve uma série de con textos linguísticos («ilhas», na sua terminologia) para fora dos quais | nenhuma regra transformacional pode mover um elemento (as chamadas «condições de Ross», ver o capítulo 14.2.1) (33). Progressivamente, a natureza do trabalho em gramática generativa vai ganhando dimensões diferentes. Uma preocupação central dos generativis tas nesta fase é a de restringir drasticamente as possibilidades descritivas dos sistemas de regras e diminuir o seu poder expressivo, ao mesmo tempo simplificando o seu formato, uma tarefa facilitada pela estratégia descrita acima. De facto, ao retirar das regras aqueles aspectos que podem ser convertidos em condições gerais, os linguistas encontravam-se com uma versão simplificada dessas regras, com uma espécie de esqueleto que cons titui de facto a sua natureza fundamental. O trabalho efectuado durante esta fase reduz assim a enorme variedade de sistemas de regras a um número muito pequeno de opções, as quais actuam em conjunto com princípios res tritivos universais na caracterização das gramáticas possíveis. A redução das regras categoriais de reescrita a um número drasticamente reduzido de opções é efectuado em Chomsky (1970) através dos princípios da teoria X-barra (ver os capítulos 6 e 7). Neste artigo, Chomsky diminui também a capacidade descritiva das regras transformacionais ao propor que determinados fenômenos linguísticos (concretamente, as construções de nominalização como a leitu ra do livro, a construção da ponte, etc.) deixem de ser tratados transformacionalmente e passem a ser caracterizados atra-
corrente (de curta duração) oposta aos modelos desenvolvidos por Chomsky, e certamente sem as preocupações psicológicas relativas à aquisição que guiavam, no fundamental, os trabalhos de Chomsky e dos seus colaboradores mais próximos (ver Newmeyer (1980)). í33) O próprio Chomsky (1962; 1964) propusera já durante a fase da Teoria Stan dard condições gerais destinadas a restringir a aplicação das regras transformacionais (entre as quais a Condição de A-sobre-A). Estas condições, no entanto, revelaram-se inadequa das, sendo substituídas pelas Condições de Ross (ver Newmeyer (1980, 177-180)).
52
véft dc uma ínteracção do léxico com o sistema das regras de rcescnüL De um modo mais gera), Chormky (1970) propõe que as regras transformacionaís nâo podem ter acesso aos morfemas derivacionais que compõem as palavras (M), A obra mais marcante do novo estilo de linguística praticado pelos generatívistas durante os anos 70 é o artigo de Chomsky «Conditions on Transformations» (Chomsky (1973)), Neste trabalho, Chomsky propõe uma série de condições sobre as regras transformacionais (a Condição da Subjacência, a Condição do Sujeito Especificado e a Condição da Oração Temporalizada, entre outras), que vão determinar consideravelmente o trabalho efectuado pelos generativistas no resto dos anos 70 (para a subjacência, ver o capítulo 14.2; para as outras duas condições, ver o capítulo 8). De facto, em certa medida, grande parte dos artigos escritos depois de Chomsky (1973) consistem na aplicação destas condições a novos dados (não neces sariamente de natureza transformacional, como as anáforas e os pronomes), o que determina, inversamente, a necessidade constante de rever e refor mular as condições no sentido de as adequar a esses dados (por vezes de modo drástico, como no caso da Condição do Sujeito Especificado e da Condição da Oração Temporalizada). O modelo que emerge progressivamente de todo este trabalho (chamado Teoria Standard Alargada, abreviado em EST, do Inglês «Extended Stan dard Theory») pode ser caracterizado como um modelo de regras e princípios (por oposição ao modelo Standard, um modelo unicamente de regras). Segundo a concepção da Teoria Standard Alargada, a gramática contém um número distinto e autônomo de componentes, cada uma delas com uma or ganização própria caracterizada por um pequeno número de regras e por princípios que restringem a aplicação dessas regras. Existe uma componente lexical, uma componente das regras de base, uma componente transfor macional, uma componente para a interpretação de pronomes e de aná foras, e assim sucessivamente. A organização interna de cada componente é simples, mas as suas interacções podem ser relativamente comple xas. Na perspectiva deste modelo, a criança é ainda de certo modo um «pequeno cientista» construindo hipóteses sobre as regras da sua língua. No entanto, o conjunto de princípios e de condições da Gramática Uni-
(34) Por exemplo, nenhuma regra transformacional pode neste modelo derivar (a) cons trução da ponte a partir da expressão (alguém) constrói a ponte através da substitui ção da morfologia verbal na forma constrói pelo sufixo derivacional -ção (entre outras operações necessárias para converter a segunda expressão na primeira). Ver o capí tulo 3.2. 53
versai determ ina crucialmcnte que o número de hipóteses acessível it critmVa é agora drasticam ente reduzido, facilitando o processo de aquisição (3S),
12. O m o d e lo d e P rin cíp io s e Parâm etros O modelo de Princípios e Parâmetros, proposto pela primeira vez em Chom sky (1981), incorpora em grande parte os resultados teóricos da Teoria Standard Alargada, bem como a sua concepção da organização da gramática em subteorias (ou módulos, ou componentes) autônomas, cada uma delas com uma organização e princípios independentes, e tendo como objecto dom ínios diferenciados da linguagem. Mais ainda do que no modelo da EST, existe uma tendência para eliminar as regras, ficando o modelo com posto no essencial por princípios extremamente gerais, distribuídos pelas várias componentes, e cuja interacção determina representações com um alto grau de complexidade. De um modelo de regras e princípios passa-se pois a um modelo unicamente de princípios. Cada uma das componentes da gram ática é extremamente simples na sua organização interna, e mantém um a rede de interacções com as outras componentes (36).
12.1. A noção de parâmetro E sta organização modular, no entanto, tem agora como pano de fundo um a concepção diferente da natureza dos princípios universais de UG. Nesta concepção, a Gram ática Universal é constituída nor dois ti nos de princípios. Tal como na Teoria Standard Alargada, UG contém jprincípios rigidos^invariáveis. e que qualquer gramática final terá de incorporar. Entre estes encontram -se, por exemplo, o princípio de Projecção (ver o capítulo 9.7), o princípio de que as orações das línguas humanas possuem necessariamente um NP sujeito £. um _VP predicado (ver o capítulo 9.8.2), e o princípio que determ ina que as regras de movimento apenas podem m over consti tuintes sintácticos (o chamado Princípio de Dependência Estrutural). Para além destes princípios rígidos, contudo, existe agora igualmente um sistem a de princípios abertos, os parâmetros. Estes são uma espécie
C35) A Teoria Standard Alargada abandona virtualmente qualquer preocupação com o sistema de avaliação de gramáticas da Teoria Standard. Isto deve-se certamente ao número extremamente reduzido de hipóteses possibilitadas pela Gramática Universal. í36) Esta concepção da organização de UG em módulos é o espelho do tipo de orga nização que Chomsky propõe para a mente humana em geral (ver a nota 8 e Chomsky (1975; 1980b; 1988b)).
54
dc «comutadores linguísticos» cujo valor final e definitivo apenas é atin gido durante o processo de aquisição, através da sua fixação (ou ligação) numa de duas posições possíveis com base na informação obtida a partir do meio linguístico ambiente. Neste modelo, a aquisição pela criança da gramática final da sua língua consiste ftssancialmftnte e.m dois aspectos; a aprendizagem das formas lexicais da língua, com as propriedades fonológicas, sintácticas e semânticas determinadas pelo «dicionário mental» e a atribui ção aos vários parâmetros da Gramática Universal do valor que possuem nessa língua. Estamos pois longe do modelo da criança como um «peque no linguista» construindo hipóteses, e que caracterizava a Teoria Standard e parcialmente a EST. Neste modelo, as opções possíveis em UG são dadas pelos parâmetros, sendo portanto muito limitadas, visto que estes são em número finito e possuem por hipótese apenas dois valores. A natureza do sistema final é ainda mais limitada, visto que são os dados primários acessíveis à criança que determinam de um modo rígido o valor atribuído a cada um dos parâmetros. Quando todos os parâmetros estão ligados, a criança adquire, uma «gramática nuclear» (em Inglês, «Core Grammar»), isto é, um sistema complexo de conexões entre os princípios universais jígidos e os parâmetros, o qual determina de um modo altamente específico as propriedades de cada língua particular. A aquisição é assim completamente identificada com o crescimento e a maturação de UG, que passa de um estado apenas parcial mente especificado (com parâmetros por fixar) a um estado completamente especificado (com os parâmetros fixados), funcionando então como um sis tema computacional (ver a secção 4) (37).
12.2. A fixação do valor dos parâmetros no processo da aquisição A ligação dos parâmetros numa dada posição é determinada pelos dados linguísticos primários simples ao alcance da criança. Ou seja, a informa ção linguística contida nesses dados permite à criança decidir qual a posi ção a atribuir a cada parâmetro. Podemos ilustrar este processo pela
|H A gramática nuclear é a componente fundamental do sistema final adquirido. Chomsky propõe que para além deste núcleo, o sistema final do falante de uma língua particu lar possui resíduos históricos, empréstimos de outras línguas, expressões parcialmente fixadas pela convenção social (como as expressões idiomáticas), em síntese, construções e ele mentos marcados, formando uma espécie de «periferia» linguística, possivelmente sub metida de modo parcial a alguns dos princípios de UG. 55
cunMdcraçio de um dos parâmetros mais discutidos na literatura generutlvista, o chamado «parâmetro do sujeito nulo» (ver também o capítulo 16.3 e a*> referências aí indicadas). A Gramática Universal contém um princípio rígido que determinu a exis tência da posição de sujeito nas orações das línguas humanas (ver o capítulo 9.8.2). A Gramática Universal, no entanto, nflo determina que essa posi ção seja necessariamente preenchida por um NP com conteúdo fonético. Assim, em línguas como o Português, o Italiano e o Espanhol, é possível deixar essa posição «vazia» (o travessão indica a posição onde devería normalmente ocorrer o sujeito fonético): (20) ___já chegaram da escola. Em línguas como o Inglês ou o Francês, a posição de sujeito tem de ser preenchida foneticamente: (21) a. *___sont déjà arrivés de 1’écoíe. b. *__ already arrived from school. (22) a. Ds sont déjà arrivés de l’école. b. They already arrived from school. A Gramática Universal põe assim à disposição da criança uma escolha, entre a realização fonética obrigatória ví. a realização fonética opcional do su; jeito da oração, ou seja, um parâmetro com duas posições possíveis que a criança terá de fixar durante o processo de aquisição (38). Esta fixação é feita com base naquilo que a criança ouve, ou seja, é feita com base nos dados linguísticos primários. Põr exemplo, uma criança que cresça numa comunidade em que se fala Português não tem dificuldade em fixar o pa râmetro na posição pro-drop, ao ouvir expressões como (20) nos seus dados linguísticos primários. Se os parâmetros são fixados pela criança com base nos seus dados linguísticos primários, a natureza destes (simplicidade, ausência de infor mação negativa, ver a secção 9) impõe por sua vez condições extremamente restritivas sobre a natureza dos parâmetros. Concretamente, o seu conteúdo tem de ser tal que a fixação possa ser feita com base em dados simples e facilmente acessíveis à criança. Um hipotético parâmetro cuja fixação ne-(*) (**) Adoptando uma terminologia utilizada nos primeiros trabalhos sobre este fenômeno linguístico, estas escolhas são designadas através das expressões «valor pro-drop» (para a realização fonética opcional do sujeito) e «valor não-pro-drop» (para a realização fo nética obrigatória). 56
comíte o acesso pela criança a frases «exóticas» e pouco frequentes na faia dos adultos é deste m odo altamente suspeito com o candidato a parâm etro cfectivo de UG. Suponham os por exem pio um hipotético parâm etro cuja fixação só po s sa ser decidida com base em frases em que co-ocorrem um pronom e in terrogativo e um pronome relativo, ou duas expressões interrogativas, com o em (23): (23)
a. Eu encontrei os livros que tu perguntaste a quem o Luís tinha emprestado. b. Que livros é que tu perguntaste a quem o Luís tinha emprestado?
Em bora (relativamente) gramaticais, estas frases são suficientemente «exó ticas» para as descartarmos do conjunto dos dados linguísticos iniriats sobretudo dada a exigência de uniformidade (ver a nota 21). Logo, ne nhum parâmetro de UG pode ser tal que necessite o acesso a estas frases para a sua fixação (39). A hipótese relativa ao papel nulo da informação negativa no processo de aquisição tem também consequências importantes para as propriedades dos parâmetros, em particular para a questão de determinar a posição em que se encontram no estado inicial (Sg) da aquisição. Existem a este res peito duas possibilidades lógicas. TJm parâmetro porte estar numa posição «neutra», independente das duas posições possíveis em que pode ser fixa do durante a aquisição (para simplificar a discussão, identifiquemos estas posições pelos símbolos «+» e «-»). Neste caso a criança tem de decidir, a partir da sua experiência linguística, se a fixação é feita em «+» ou em «-», ou seja, num determ inado m omento, o parâm etro é «ligado» num des tes dois valores a partir de um a posição previamente neutra. A outra possibilidade é de que um parâm etro tenha um valor primiti vo não m arcado («+» ou «-»), ou seja, que o processo de aquisição co mece im ediatam ente (em Sg) com o parâmetro fixado num a das duas po sições possíveis, antes mesmo que a criança tenha sido exposta a quais-
(39) Esta discussão tem um interesse histórico porque o primeiro parâmetro sugerido na literatura generativista (em Rizzi (1982, 73-74)) necessitaria de dados deste tipo para a sua fixação, sendo portanto extremamente implausível do ponto de vista da aquisição (ver o capítulo 14.2.2, para mais pormenores). Note-se, no entanto, que o estatuto (relativamente) aceitável destas frases em línguas como o Português implica que os princípios e os parâmetros (fixados) da Gramática Uni versal têm de possuir as propriedades necessárias para permitir o desenvolvimento de uma gramática que as caracterize como gramaticais nestas línguas.
57
quer dudos linguísticos iniciais. Neste caso, se a língua à qual a criança é exposta tiver para esse parâmetro valor idêntico ao da ligação inicial, a crian ça não procede a nenhuma alteração; se, pelo contrário, u língua aprendi da tem o valor oposto para o parâmetro, a criança terá de mudar o valor inicial com base nas expressões que ouve. Concretamente, na ausência de evidência linguística contraditória nos dados primários, a criança não toca no parâmetro; apenas se os dados linguísticos contiverem evidência con traditória mudará então a criança o valor do parâmetro. Consideremos agora, à luz da hipótese sobre a ausência de informação negativa no processo de aprendizagem (cf. a secção 9), as implicações que ca da uma destas possibilidades tem relativamente ao parâmetro do sujeito nulo. Suponhamos que no estado inicial S0 este parâmetro é neutro relativa mente a qualquer dos valores «+» ou «-» que pode tomar. Para uma crian ça que aprende Português, a tarefa de fixar o parâmetro no valor «pro-drop» não oferece problema: orações como (20), sem sujeitos fonéticos, são su ficientemente abundantes nos dados iniciais para permitir à criança decidir que a sua língua é efectivamente «pro-drop», e ligar o parâmetro com esse valor. Note-se que neste caso a criança procede à fixação do parâmetro unicamente com base em informação positiva (isto é, a existência de ex pressões como (20) no seu meio linguístico ambiente). Para a criança que aprende Inglês, contudo, a tarefa é mais complica da. É certo que orações como (21b) não são gramaticais nesta língua, mas crucialmente, a criança não tem por hipótese acesso a esta conclusão, visto que se trata de informação negativa. Neste caso, para permitir a fixa ção correcta, temos de abandonar parcialmente a ideia de que a informa ção negativa não desempenha nenhum papel na aquisição, embora conti nuando a não permitir que as correcções, as instruções explícitas, as explicações gramaticais, etc., possam ter um papel relevante. Chomsky (1981, 9) admite que em certas circunstâncias, o facto de uma determinada estrutura não ocorrer nos dados linguísticos primários (aquilo a que chama infor mação negativa indirecta) é suficiente para fixar o valor de um parâme tro, sem que esse processo inclua correcção ou instruções explícitas (ou seja, informação negativa directa). Aceitando esta conclusão, a criança que aprende Inglês acabará eventualmente por fixar o valor do parâmetro na posição «não-pro-drop», não porque leve acesso à informação de que (21b) não é gra matical, m a s simplesmente porque, num determinado momento da matu ração da sua UG, o facto de nunca ter ouvido tais expressões é suficiente para fixar o parâmetro nessa posição í40).
I I I Note-se que a criança terá de «ignorar» a existência de frases imperativas (eat your soup!) nos seus dados primários, o que significa que possui informação suficiente
58
Suponhamos agora que o parâmetro tem um determinado valor não mar cado, ou seja, que no estado inicial S0 se encontra desde logo ligado nesse valor. Como veremos, esta hipótese permite manter a versão forte da ideia de que a informação negativa (incluindo a informação negativa indirecta) não desempenha nenhum papel na aquisição da linguagem, se o valor não marcado do parâmetro for a posição não-pro-drop. Suponhamos então, de um modo mais concreto, que as crianças entram (universalmente) no processo de aquisição com o valor do parâmetro do sujeito nulo fixado na posição não-pro-drop. Se uma criança cresce numa comunidade em que se fala Inglês, não toca no parâmetro, visto que no seu meio linguístico ambiente não existem dados positivos que contradi gam a fixação predeterminada do parâmetro (mas ver a nota 40). Se a crian ça cresce numa comunidade onde se fala Português, tem acesso a frases como (20) ou seja, informação positiva que contradiz directamente a fixa ção original do parâmetro. Com base nesta informação, a criança coloca o comutador na posição oposta. Neste modelo, a informação negativa indi recta não desempenha nenhum papel na aquisição. Em resumo, se adoptarmos o modelo da teoria dos parâmetros em que estes são inicialmente neutros quanto à sua ligação final, temos de permitir que a informação negativa indirecta seja relevante na aquisição do sistema linguístico final. A manutenção da versão forte da hipótese sobre a não pertinência da informação negativa exige que adoptemos um modelo específico da teo ria dos parâmetros, em que estes possuem um valor inicial não marcado e que apenas é alterado no decurso da aquisição se houver evidência po sitiva em contrário nos dados primários. Os psico-linguistas que trabalham no quadro teórico da Teoria de Princípios e Parâmetros têm usualmente favorecido esta última hipótese, embora seja ainda prematuro, nesta fase das investigações sobre a aquisição, adiantar conclusões rígidas (ver sobre estas questões os vários trabalhos em Roeper e Williams (eds.) (1987)). Berwick (1982) propôs uma formalização parcial, em termos da teoria dos conjuntos, da hipótese sobre a não pertinência dos dados negativos na selecção do valor dos parâmetros. Esta formalização é expressa no Princípio do Subconjunto (adaptado de Chomsky (1986b, 146)): (24) Princípio do Subconjunto Se um parâmetro tem dois valores, «+» e «-», e o valor «-» determina uma linguagem que é um subconjunto da linguagem
sobre a estrutura destas frases que lhe indicam que não deve generalizar a ausência do sujeito às outras orações da língua.
59
determinada pelo valor «+», então o valor «-» é o valor nflo-mar cado, seleccionado por UG na ausência de qualquer evidência linguística. Ilustremos a situação descrita pelo princípio (24) através de um diagrama de Venn (a linguagem A inclui propriamente todas as frases da lingua gem B): (25)
O princípio (24) determina que o parâmetro | tem o valor não-marcado que determ ina a linguagem B («-»), visto que esta é um sub-conjunto próprio da linguagem A. Suponhamos que a criança cresce numa comunidade onde se fala B. Nesse caso, a ligação primitiva do parâmetro é consistente com os dados primários (positivos) a que tem acesso. Suponhamos agora que a criança cresce numa comunidade onde se fala A. Nesse caso, ela tem igualm ente acesso a dados positivos (nomeadamente as frases de A não pertencentes a B) inconsistentes com o valor inicial do parâmetro, e que lhe permitem facilm ente mudar esse valor de «-» para «+», determinando a linguagem A. Suponhamos agora, contrariamente ao princípio (24), que o valor não-m arcado, inicial, do parâmetro é aquele que determina a linguagem A (isto é, a linguagem maior). Se a criança cresce numa comunidade onde se fala A, a ligação inicial é consistente com os dados primitivos, e é portanto m antida. No entanto, surgem agora problemas no caso de a criança cres cer num a comunidade onde se fala B. Nesse caso, os dados primários a que tem acesso são certamente consistentes com a fixação inicial do parâmetro, dado que a linguagem B fa z parte da linguagem A, e, logo, tem de ser também determinada por esta fixação. Para efectuar a mudança do valor «+» para o valor «-», a criança necessitaria neste caso de informação negativa sobre a sua língua, isto é, da informação de que as frases em A mas não em B não são gramaticais na língua (B) que está a adquirir. Con60
cluímos pois que o Princípio do Subconjunto, proibindo que o valor ini ciai do parâmetro seja aquele que determina a linguagem A, é de facto a formalização da hipótese de que a informação negativa não desempenha nenhum papel na aquisição da gramática. O valor não-marcado que assumimos para o parâmetro do sujeito nulo (a posição não-pro-drop) é uma consequência directa do Princípio do Sub conjunto. Numa língua pro-drop, a omissão do sujeito é apenas opcional. Assim, a cada frase de uma língua não-pro-drop correspondem duas fra ses numa língua pro-drop: (26) They arrived late. (27) a. Eles chegaram tarde, b. Chegaram tarde. Qualquer língua pro-drop é assim «maior» que uma língua não-pro-drop, incluindo-a propriamente. Logo, o Princípio do Subconjunto determina que o valor inicial do parâmetro do sujeito nulo é a posição não-pro-drop, aquela que corresponde à linguagem «menor». Se atribuirmos o Princípio do Subconjunto à estrutura cognitiva da criança, fazemos então uma hipótese extremamente forte sobre o mecanis mo de aquisição inicial, e em particular sobre o decurso da aquisição, que é possível pôr à prova através de estudos empíricos sobre o desenvolvi mento linguístico da criança (41).
(4I) Relativamente ao parâmetro do sujeito nulo, o Princípio do Subconjunto prediz que as crianças que aprendem Português, por exemplo, iniciam a aquisição com uma gramática não-pro-drop que não permite sujeitos nulos, e que apenas mais tarde começa rão a utilizar estas expressões, depois do valor do parâmetro ter sido mudado. Construir experiências psico-linguísticas que provem estas predições não é no entanto uma tarefa fácil, pela simples razão de que existem outros factores em jogo (como, por exemplo, factores de performance) que podem mascarar total ou parcialmente os efeitos que espe raríamos de uma dada fixação do parâmetro. Hyams (1986; 1987), baseada em dados de aquisição de crianças italianas e ingle sas, desenvolve uma análise em que o valor inicial do parâmetro do sujeito nulo é a po sição pro-drop (Hyams mostra que as crianças inglesas produzem frequentemente e siste maticamente frases sem sujeitos antes de passarem a uma fase em que incluem o sujei to). Esta análise não é à primeira vista consistente com o Princípio do Subconjunto. Hyams no entanto sugere que as línguas não-pro-drop não são na realidade um subconjunto próprio das línguas pro-drop, e que o Princípio do Subconjunto não se pode pois aplicar no seu caso. Não cabe no âmbito deste livro discutir esta questão, e reenviamos o leitor para os trabalhos citados acima. Para uma visão discordante de Hyams, ver Bloom (1990). 61
12 V Os parâmetros eomo princípios abstractos Um modelo tentador da noção de parâmetro consiste na ideia de que os parâmetros sâo o reflexo directo de propriedades linguísticas «concre tas*. dircctamente observáveis nos sistemas gramaticais. Nesta concepção, o valor de cada parâmetro correspondería biunivocamente a uma proprie dade simples de um sistema linguístico, e o valor oposto correspondería à propriedade contrária, existente noutro sistema linguístico. Nesta visão ingênua, qualquer diferença superficial entre duas línguas seria motivo su ficiente para postular um parâmetro na Gramática Universal, a qual confe ria um número tão elevado de parâmetros que a aquisição do sistema fi nai seria uma tarefa extremamente difícil, se não mesmo impossível, de •tingir. Na TRL, no entanto, os parâmetros são propriedades abstractas da Gramática Universal que não se encontram em correspondência biunívoca com propriedades simples (diiectamente observáveis) dos sistemas lin guísticos. A fixação de um parâmetro num valor a determina (em interacção com outros princípios de UG) feixes complexos de propriedades con cretas em pontos diversos da gramática, podendo mesmo algumas dessas propriedades possuir uma relação bastante remota e indirecta com a natu reza mais imediata do parâmetro. Plausivelmente, UG contém apenas um pequeno número de parâmetros deste tipo distribuídos pelas várias com ponentes do sistema. Exemplificando de novo com o parâmetro do sujeito nulo, esta pers pectiva implica em primeiro lugar que a formulação exacta do parâmetro não refere necessariamente a propriedade concreta da omissão/não omissão do sujeito, mas sim uma propriedade mais abstracta de UG que tem como efeito a possibilidade (ou impossibilidade) de omitir o sujeito (para uma discussão concreta, ver o capítulo 16.3). Em segundo lugar, este modelo da noção de parâmetro prediz que a omissão do sujeito é apenas uma das propriedades concretas que se encon tram associadas à fixação do parâmetro na posição pro-drop, o que é con firmado pela análisç linguística (ver também a discussão no capítulo 16.3). Este modelo abstracto da noção de parâmetro tem implicações impor tantes para os estudos de gramática comparativa e de gramática histórica. Em gramática comparativa, toma-se possível reduzir feixes de diferenças superficiais entre dois sistemas linguísticos à fixação de valores opostos num único parâmetro (ou num número muito reduzido de parâmetros); em gramática histórica, toma-se possível conceber as mudanças históricas em lermos da mudança do valor de um ou mais parâmetros num dado sistema linguístico. Muitas das considerações feitas na subsecção ante rior relativamenle à fixação dos parâmetros durante a aquisição são igual62
mente aplicáveis neste último caso, algo que não podemos desenvolver aqui.
13. Conclusão Como assinalámos no início deste capítulo, o modelo de Princípios e Parâmetros, e em particular a noção de parâmetro, têm possibilitado a jun ção de estudos puramente gramaticais sobre a estrutura de línguas indivi duais com estudos psico-linguísticos de natureza «experimental» sobre a aqui sição e o desenvolvimento da linguagem, e com estudos de gramática com parativa. Esta interdisciplinarídade está ainda no seu começo, e não temos dúvidas que trará desenvolvimentos e modificações consideráveis à visão específica do modelo de UG proposta na TRL, e em particular à noção de parâmetro que apresentámos nesta secção.
Capítulo 2
Estrutura de constituintes e categorias gramaticais
1. E strutura de constituintes As frases das línguas humanas são formadas superficialmente por uma sequência linear ordenada de itens lexicais, que podemos neste ponto da exposição identificar (aproximadamente) com as palavras. Nem todas as sequências constituem expressões gramaticais. Veja-se, por exemplo, o contraste entre (la) e (lb,c) em Português: (1) a. O mecânico limpou o automóvel com um pano. b. | O limpou mecânico automóvel o pano um com. c. | O um o com mecânico limpou automóvel pano. A não gramaticalidade de (lb,c) sugere que a competência do falante/ /ouvinte do Português contém um mecanismo que atribui uma estrutura interna à sequência linear de elementos numa oração, e que a estrutura atri buída por esse mecanismo é incompatível com as sequências (lb,c). As sim, em (la) as palavras o e mecânico juntam-se para formar um grupo hierarquicamente superior (o mesmo acontecendo com o automóvel e um pano). A palavra com e a sequência um pano, por sua vez, formam ou tra unidade de nível superior. O verbo limpou e as duas sequências o au tomóvel e um pano formam a sequência limpou o automóvel com um pano, hierarquicamente superior aos seus elementos constituintes. Finalmente, os grupos o mecânico e limpou o automóvel com um pano formam a sequência estruturalmente mais elevada, ou seja, a frase. É a impossibili dade de atribuir uma estrutura interna deste tipo às expressões (lb,c) em Português que as toma não gramaticais. Por exemplo, em (lb,c) as regras da gramática impedem que a forma o isoladamente, ou a forma o junta mente com a forma lavou ou com a forma um formem um grupo sintáctico. A organização de uma frase em grupos hierárquicos complexos construídos 65
por uma inclusão sucessiva de elementos de nível inferior em grupos maiores, começando pelos itens lexicais, chama-se estrutura de constituintes. A estrutura de constituintes de (Ia) é representada no seguinte diagra ma: í?)
| o mecânico limpou o automóvel com um pano | o mecânico
[o
mecânico
|[ limpou o automóvel com um pano | limpo
Cada grupo sintáctico numa estrutura do tipo de (2) é um constituinte
(por exemplo, o mecânico, com um pano, limpou o automóvel com um pano ou a própria frase no seu todo). Em cada nível, dois ou mais cons tituintes agrupam-se para formar um constituinte de nível hierárquico ime diatamente superior que os inclui. Diz-se então que são constituintes ime diatos do constituinte resultante. Assim, por exemplo, a preposição com e o constituinte um pano são constituintes imediatos do constituinte hierar quicamente superior com um pano. A existência da estrutura de constituintes é facilmente verificável atra vés da comparação da frase (3a) com a frase (3b): (3) a. O Luís comprou o carro do João. b. O Luís comprou o carro ao João. De um ponto de vista linear, estas duas expressões diferem apenas relativamente às preposições que antecedem o constituinte o João respectivamente de e a (*). Mau grado a quase identidade linear entre (3a) e (3b), estrutu ras de constituintes respectivas apresentam diferenças importantes. Em (3a), por exemplo, a sequência o carro do João pode ser clivada (isto é, colo cada na parte inicial da frase entre um a form a do verbo ser e a form a que), ao passo que em (3b) a sequência praticamente idêntica o carro ao João não pode: 0) A preposição de contrai com o artigo definido o formando do; e a preposição a forma & unidade ortográfica ao com o artigo definido masculino. Na análise sintáctica, ignoram-se usualmente estas operações morfológicas, representando cada morfema como um item lexical independente. 66
(4) a. Foi o carro do João que o Luís comprou, b. * Foi o carro ao João que o Luís comprou. A sequência o carro do João é o sujeito da frase passiva correspondente a (3a), mas a sequência o carro ao João não é sujeito de nenhuma frase passiva correspondente a (3b): (5) a. O carro do João foi comprado pelo Luís. b. * O carro ao João foi comprado pelo Luís. Factos desta natureza permitem concluir que a sequência o carro do João em (3a) forma um constituinte mas que a sequência o carro ao João em (3b) não é um constituinte; visto de outro modo, em (3a) o constituinte do João (resultado da ligação da preposição de com o constituinte o João) forma com o carro um grupo hierarquicamente superior — o constituinte o carro do João. Pelo contrário, tal não se passa em (3b): aqui, o consti tuinte ao João não se junta a o carro para fo rm a r um constituinte de ordem superior. Para uma discussão mais detalhada destas questões, ver Raposo (1978).
2. Categorização gramatical Os vários elementos que constituem a estrutura de constituintes de uma expressão linguística, desde os itens lexicais até à frase, são classificados num número finito de categorias gramaticais.
2.1. Categorias lexicais e categorias sintagmáticas Os itens lexicais de uma língua podem ser classificados num número finito de categorias lexicais. As categorias lexicais mais importantes (chamadas categorias lexicais principais) são o Substantivo ou Nome (N), o Adjectivo (A), o Verbo (V), a Preposição (P) e o Advérbio (Adv). Cada uma destas categorias, por sua vez, é o elemento central de uma categoria hierarquicamente superior na estrutura das frases. Assim, a categoria N é a categoria lexical central da categoria hierarquicamen te superior Grupo Nominal (NP); a categoria P é a categoria central da categoria Grupo Preposicional (PP); e assim sucessivamente. As cate gorias superiores construídas com base nas categorias lexicais chamam-se categorias sintagmáticas. Para além de uma categoria lexical, as catego rias sintagmáticas contêm modificadores (ver o capítulo 6). A correspon67
ik'iK ia entre categorias lexicais e categorias sintagmáticas é representada esqucmaticamente na tábua (6); em (7) e (8) apresentam-se exemplos de cada categoria: (6)
(7)
(i) N (ü) A (iü)V
(iv) P (v) Adv (8)
Categoria Sintagm dtica Grupo Nominal (NP) Grupo Adjectival (AP) Grupo Verbal (VP) Grupo Preposicional (PP) Grupo Adverbial (AdvP)
Categoria Lexical Nome (N) Adjectivo (A) Verbo (V) Preposição (P) Advérbio (Adv)
(i) NP
(ii) AP (iii) VP
- ( i i PP (v) AdvP
mecânico, automóvel, pano, dinheiro, justiça, con quista, Paulo, cavalo, motocicleta atraente, corajoso, mau, estúpido, fiel arrumar, vender, parecer, chover, ocorrer, limpar a, com, por, sobre, antes de, sem, para ontem, já, depressa, devagar, rapidamente o mecânico, o automóvel, um pano, a rapariga que saiu, a mulher bonita, o homem da pistola de ouro, a minha casa sobre o lago contente com os meus alunos, feliz com a situação, alto, capaz de resolver um problema de matemática desmaiou, comeu trinta bifes, levou a carta a Gar cia, persuadiu a Joana a ficar, disse que o jornal já saiu, limpou o automóvel com um pano com um pano, sobre a mesa, para a Maria ficar con tente, antes da Joana, ao Luís, de Roma muito depressa, pouco rapidamente, nada bem
Os pronomes pessoais e demonstrativos como ele, nós, este, isso, aquietc., contrariamente ao que a sua denominação indica, substituem a categoria sinlagmática NP e não a categoria lexical N. Assim, por exem plo, na frase o aluno inteligente tirou um a boa nota, o pronome pessoal ele pode substituir o NP o aluno inteligente mas não o nome aluno: ele tirou um a boa nota, mas não *o ele inteligente tiro u um a boa nota. Entre as categorias lexicais menores, reconhecemos, entre outras, a categoria Determinante (D), que inclui os artigos definidos (o, a, os, as) e as formas adjeclivais demonstrativas (este/a, esse/a, aquele/a); a categoria Quantificador (Q) (nenhum, algum(ns), nada, vários, etc.); e a categoria Possessivo (Poss) (meu/minha, teu/lua etc.). Estes elementos fazem em 68
geral parte da categoria sintagmática NP, como nos exemplos esse meu amigo, vários estudantes, etc. (?) 2.2. Composição interna das categorias lexicais Chomsky (1970, 199) sugere que as categorias lexicais principais V, N, A e P são o produto de uma combinação de traços distintivos binários, do mesmo modo que um segmento fonológico. Em Chomsky e Lasnik (1977, 430), sugere-se que o sistema formado pelos dois traços categoriais [+ N(ome)] e [ + V(erbo)] permite distinguir exaustivamente essas quatro categorias lexicais: (9) Nome 1 Verbo 1
Adj +N +V
Prep -V -N
Nesta análise, a categoria lexical A é a combinação dos traços [+V, +N]; a categoria V, dos traços [+V, -N]; a categoria N, dos traços [-V, +N]; e a categoria P, dos traços [-V, -N]. Este sistema permite estabelecer classes naturais de categorias lexicais principais, as quais por sua vez permitem formular generalizações linguísticas que ficariam perdidas se não as reconhecéssemos. As classes naturais que podemos estabelecer com base neste sistema são quatro (*): (10) (i) (ü) (iii) (iv)
[+N] [+V] [ -N] [-V]
A, A, V, N,
N V P P
o Para uma caracterização mais detalhada das categorias lexicais e sintagmáticas em Português, ver Raposo (1978) e Mateus et al. (1989). Nos capítulos 6 e 7 propomos uma análise algo diferente das categorias sintagmáticas. H Stowell (1981) apresenta vários argumentos em favor desta classificação, com base em fenômenos gramaticais que afectam de um modo consistente apenas os membros de uma determinada classe natural. Assim, por exemplo, existem línguas que não diferen ciam categorialmente entre os elementos que pertencem a uma mesma classe. Por moti vos de simplicidade, continuamos a representar as categorias através do seu símbolo categorial | não através da sua combinação de traços, a menos que esta seja relevante para a exposição em curso. 69
3, Representações estruturais A estrutura de constituintes de uma frase e a categorizaçfio gramatical dos constituintes pode ser representada esquematicamente num Indicador Sintagmdtico. As duas formas mais comuns que um indicador sintagmático toma são a representação em árvore e a representação em parentetização etiquetada.
3.1. Representações em árvore Na representação em árvore, cada constituinte corresponde a um nó (in cluindo as palavras, que são os constituintes terminais da estrutura). Cada nó, por sua vez, recebe uma etiqueta que corresponde ao nome (abrevia do) da sua categoria gramatical. Por simplicidade omitimos os nós nas árvores, e escrevemos apenas os nomes das categorias gramaticais: cada etiqueta corresponde pois a um nó da representação estrutural. Os nós/etiquetas encontram-se ligados por ramos, os quais representam as relações de inclusão que os constituintes mantêm entre si. A representação em árvore de (la) é dada em (11) (numeramos os NP que ocorrem neste diagrama). Repare-se que os itens lexicais ocorrem apenas uma vez, ligados aos nós que representam as categorias lexicais; ou seja, os constituintes inter médios não aparecem escritos junto dos nós sintagmáticos intermédios. A informação de que uma determinada sequência é um constituinte é ob tida pelo facto de existir na árvore um nó que corresponde única e exclu sivamente (exaustivamente) a essa sequência. Assim, por exemplo, a sequência com um pano é um constituinte e, como tal, corresponde exaus tivamente a um nó (intermédio), assinalado com um círculo em (11). Podemos agora representar de um modo claro as diferenças estruturais entre (3a) e (3b). A árvore (12) corresponde à estrutura de (3a) e a árvore(13) à estrutura de (3b). Enquanto que em (12) o VP contém apenas dois constituintes imedia tos, o verbo e o NP o carro do João, em (13) o VP contém três consti tuintes imediatos, o verbo, o NP o carro e o PP ao João. Repare-se que em (12) a sequência do João é um PP, tal como ao João em (13), mas num nível hierárquico inferior. Visto de outro modo, em (13) a sequência o carro ao João não é um constituinte da frase, contrariamente à sequência o carro do João em (12).
(li)
s
um
pano
o
71
João
.V2.
Representações em parentetízaçfio e tiq u e ta d a
A estrutura de (la) na forma de parentetizaçio etiquetada é apresenta da cm (14) (numeramos de novo os NPs): (14) (s (W1 [Do]] [[N mecânico]] [vp [v limpou] [NW (D ol (N automóvel]] tpP [P com] [D um] [N pano]]]]] Numa parentetização etiquetada, cada par de parênteses encerra um cons tituinte da frase. A categorizaçio gramatical é feita através da subindexação de cada par de parênteses com a etiqueta correspondente ao nome da categoria a que pertence; por convenção, coloca-se a etiqueta no parêntese que abre o constituinte. Os cinco parênteses no final de (14) correspon dem ao fecho dos constituintes de categoria N, NP, PP, VP e S, respectivaraente. As árvores e as parentetizações etiquetadas constituem formas particu lares (entre outras possíveis) de representar a estrutura de constituintes das fiases. Cada uma delas tem vantagens e desvantagens. As árvores apresen tam a estrutura de uma forma muito mais visual e imediata, sem grandes dificuldades de leitura. As parentetizações etiquetadas, pelo contrário, são mais difíceis de ler, e tomam-se especialmente pesadas nos casos em que se apresenta a estrutura frásica de uma forma detalhada, como em (14). No entanto, quando se pretende focar aspectos relativamente simples e gerais da estrutura sintáctica, as parentetizações etiquetadas tomam-se mais apro priadas (e ocupam menos espaço). Assim, por exemplo, se estivermos in teressados em representar apenas a divisão principal da frase (la ) em NP e VP, é mais simples e econômico fazê-lo em termos de uma parentetiza ção etiquetada: (15)
[s [KT o mecânico] [&, lim pou o automóvel com um pano]]
Para omitir a estrutura interna de um constituinte complexo num a repre sentação em árvore, utiliza-se a convenção «dos triângulos»:
m WeÉêêT:, $ o mecânico
limpou o automóvel com um pano
72
4. R elações estruturais entre constituintes Existem duas relações formai» básicas entre os constituintes de uma frase: a relação linear de precedência e a relação inclusiva de dominância. Estas relações são definidas através das configurações estruturais entre os nós de uma árvore. Nas definições que se seguem, x, y e w representam nós ar bitrários. Começamos pela definição da relação de dominância: (17) Dominância x domina y sse (se e só se) existir uma sequência conexa de um ou mais ramos entre x e y e o percurso de x até y através desses ramos for unicamente descendente. A relação de dominância reduz-se à relação de inclusão existente entre cons tituintes, isto é, ao facto de uma determinada categoria ser constituinte de outra. Por exemplo, em (11) o constituinte VP (limpou o automóvel com um pano) domina os constituintes V (limpou), NP2 (o automóvel) e PP (com um pano), visto que existe uma sequência de ramos conexa e des cendente (neste caso de cardinalidade = 1) entre o VP e cada um destes constituintes. Em (11), V, NP2 e PP são pois constituintes do VP. O VP domina igualmente o NP3 um pano e cada uma das categorias que cons tituem este NP; logo, NP3, o Det um e o N pano são igualmente consti tuintes do VP. E fácil verificar que S (a frase) domina todas as categorias da estrutura, sendo pois todas elas constituintes de S. Por outro lado, NP1 (o mecânico), ainda que se encontre numa posição estruturai mais eleva da que NP3 (um pano), não domina NP3, visto que não existe nenhuma sequência de ramos conexa e descendente entre o primeiro e o segundo nó. O mesmo se passa relativamente às categorias NPI e VP. Um caso particular de dominância é a dominância imediata, caracteri zada do seguinte modo (4): (18) Dominância Imediata x domina imediatamente y sse jc domina y e não existe nenhum w tal que x domine w e w domine y. (18) equivale a dizer que entre x e y existe um e um só ramo descendente. Esta definição capta a noção de Constituinte Imediato. Em (11), V (lim pou), NP2 (o automóvel) e PP (com um pano) são constituintes imedia-
(4) Assumimos que a relação de dominância é reflexiva, isto é, que um nó x se do mina a si próprio. 73
tos do VP (limpou o automóvel com um pano). Configuracionalmentc, VP d o m in a imediatamente os nós V, NP2 e PP. A relação linear de precedência é definida do seguinte modo:
o
(19) Precedência x precede y sse a sequência terminal dominada por x estiver à esquerda da sequência terminal dominada por y e não houver uma relação de inclusão ou intersecção entre essas sequências. Em (11), por exemplo, NP2 precede PP, visto que a sequência terminal dominada pelo primeiro nó (o automóvel) se encontra à esquerda da se quência terminai dominada pelo segundo (com um pano), e as sequências excluem-se mutuamente. O VP, pelo contrário, não precede o PP, porque as sequências terminais que correspondem a esses nós se encontram muna relação de inclusão (limpou o automóvel com um pano inclui com um pano). O modo como as relações de dominância e precedência são definidas implica que os membros de qualquer par de nós numa árvore se encontram ou numa relação de dominância ou numa relação de precedência, mas nunca nas duas simultaneamente. Esta situação pode ser explicitamente formula da através da seguinte Condição de Exclusividade (ver Partee, ver Meulen e Wall (1990, 442)): (20)
Condição de Exclusividade Para qualquer par de nós x e y numa árvore, (x, y) estão numa relação de precedência sse (x, y) não estão numa relação de dominância.
A definição da relação de dominância permite determinar de forma auto mática se uma dada sequência de elementos (com ou sem elementos ter minais) é ou não um constituinte, a partir da análise da árvore que lhe corresponde. O algoritmo relevante, neste caso, é o seguinte ({A} repre senta qualquer sequência de categorias sintagmáticas e/ou categorias lexi cais e/ou itens lexicais): (21) Uma sequência {Â] é um constituinte sse estiver dominada exaustivameníe por um nó x. Por exemplo, a sequência V NP2 com um pano em (11) é um constituin te porque se encontra exaustivamente dominada pelo nó VP. A sequência o carrojao João (ou NP2 PP) em (13), no entanto, não é um constituin te, naymedida em que não existe nenhum nó que a domine exaustiva mente. Para finalizar esta discussão técnica da «geometria» das árvores, intro duzimos as definições de pai e de irmão: 74
(22) Pai x
é pai de
y
sse x dominar
y
imediatamente.
Em (11) VP é pai de V, NP2 e PP, mas não é pai de P ou NP3. ínversamente, V, NP2 e PP são f il h o s de VP. (23) Irmão x é irmão de y sse
x
e
y
tiverem o mesmo pai vc.
Em (11), V, NP2 e PP são irmãos entre si, visto que possuem um pai comum, VP. Consideremos agora de que modo as relações entre constituintes são representadas numa parentetização etiquetada. Por conveniência, repetimos aqui a estrutura (14):
04) [s [NP1 [Do] [Nmecânico)] [vp [v limpou] [NT2[Do] [Nautomóvel]] 11 [P com]
[D um] [N pano]]]]]
A dominância entre constituintes aparece aqui como por uma relação de inclusão entre os (pares de) parênteses que encerram esses constituin tes. Assim, os pares de parênteses etiquetados V, NP2 e PP estão incluídos no par de parênteses etiquetado VP. A precedência entre constituintes é repre sentada por uma relação linear de ordem entre os (pares de) parênteses que encerram esses constituintes, desde que entre eles não haja uma relação de inclusão (ver a Condição de Exclusividade (20)). Assim, por exemplo, o par de parênteses etiquetado V precede o par de parênteses etiquetado NP2, mas o par de parênteses etiquetado VP não precede o par de parênteses etiquetado NP2. Um par de parênteses x é pai de um par de parênteses y se o inclui imediatamente (isto é, não pode haver um par de parênteses adicional w tal que x inclua w e w inclua y)\ e um par de parênteses x e | são irmãos se tiverem o mesmo par de parênteses w como pai.
5. Regras de reescrita categorial Uma vez estabelecido que as frases se organizam em termos de estru tura de constituintes, é necessário determinar quais são as regras que per mitem engendrar (ou gerar) essas estruturas, e qual é a sua natureza (5).
(5) Relativamente ao significado dos termos «generativo», «gerar» ou «engendrar» na gramática generativa, ver o capítulo 1, pp. 32-33. 75
Nos modelos da gramática generativa que precedem a TRL, a estrutu ra dc constituintes é caracterizada por um conjunto de regras chamadus de rtescrita categoríal ou, mais simplesmente, regras categoriais (na trudição européia, também regras sintagmáticas). Em (24) e (25) apresentamos um pequeno conjunto de regras desse tipo, capaz de gerar nfio só as es truturas (11), (12) e (13) e as expressões que lhes correspondem, mas também um conjunto potencialmente, infinito de frases do Português com a sua re presentação estrutural (as categorias encerradas em parênteses curvos são facultativas na reescrita das regras, e aquelas sobrepostas em chavetas re presentam uma escolha alternativa) (6): (0 (ii)
s —— > NP —
NP > (D)
(iii) VP —— > V (iv)
VP —— > Vcop
(V) p p - — > p (vi) AP —— > A d) (ii) (iii) Çv) (V) (Vi)
VP N
(PP)
tewre (NP) ] AP> ( PP ) NP (PP)
— > mecânico, automóvel, pano, João, Luís, carro. general, tropas, movimento, prisioneiro,... > limpar, comprar, cantar, cair, colocar, pôr,... V V cop 1 — > estar, ser, continuar, permanecer,... — > com, de, a, sobre, em... p — > contente, fácil, duro,... A H —— > o, os, as, um, este, esses,... N
Distinguimos aqui as regras (24), que constroem a estrutura sintáctica através da introdução de nós não terminais, das regras (25), que introdu zem os elementos terminais da estrutura (os itens lexicais). No próximo capítulo, veremos que estes dois processos são de natureza fundamental mente diferente. Estas regras têm todas a seguinte forma: (26)
X ------ > (U)... Y... (Z)
l i A notação i«Vco(» representa a categoria «verbo copulativo», como ser, estar, pa’ recer, ele. (ver a regia (25iii)). 76
Km (26), a seta indica que o símbolo à sua esquerda (X) sofre uma ope ração de expansão ou reescrita, da qual resultam os símbolos (ou o símbolo) à sua direita Í(U)...Y...(Z)). Nas regras categoríais das gramáticas das línguas humanas, ocorre um único símbolo à esquerda da seta, e ocorre pelo menos um símbolo na parte direita da seta Ç). O símbolo inicial S, que não é introduzido por nenhuma regra é o símbolo axiomático do sistema. Para além de (la)/(l 1), (2)/(12) e (3)/(13), estas regras permitem gerar (entre muitas outras) as frases/representações estruturais de (27) (*): (27) a. b. c. d. e.
§ | o general] [yp pôs as tropas] em movimento]] | | j o prisioneiro] j | | [v cantou]] [NP. o prisioneiro] [w [v interrogou] [w o general]] | O Luís] [yp pensa | (que) [NT o general] [yp caiu]]]]. O general [vp [Vcop está] | | [A contente] j | com as tropas]]].
Começando pelo nó axiomático S, as regras aplicam-se sucessivamente até que os últimos nós introduzidos já não podem ser reescritos, devido a não figurarem na parte esquerda de nenhuma regra (estes são os nós ter minais, que correspondem neste sistema aos itens lexicais). A esta cons trução progressiva de uma estrutura sintáctica através da aplicação das regras chama-se derivação. Como exemplo, apresentamos a derivação de (27c). A primeira regra a aplicar-se é (24i), expandindo o símbolo axiomático S: (28)
S NP
VP
Qualquer das duas categorias NP ou VP pode ser agora expandida (a ordem é arbitrária). Aplicando uma das opções permitidas por (24iii) sobre o VP, obtemos a estrutura: (29). A aplicação de uma das opções de (24ii) sobre o NP mais à esquerda produz a subestrutura (30). Aplicando de novo (24ii) sobre o NP mais à direita, obtemos a subestrutura em (31). Finalmente, a aplicação sucessiva das regras adequadas de (25) produz a estrutura (32).
O Para uma discussão simplificada da forma das regras, ver Raposo (1978, capítu lo 8); para uma discussão detalhada da teoria matemática das gramáticas e das linguagens geradas por essas gramáticas, ver Partee, Meulen e Wall (1990, capítulos 16 e sgs.) (8) Estas são dadas em forma de parentetização etiquetada; deixamos omissos vários aspectos estruturais. O item que é colocado entre parênteses visto que ainda não apre sentámos a regra para a sua introdução (ver a secção 7.2.). 77
O conjunto de regras (24) possui a propriedade da recursividade. Num sistema recursivo, determinadas regras permitem que uma catcgoriu expan dida reapareça na sua própria expansão (directa ou indirectamente). No sis tema proposto acima, as regras (24i) e (24iii) formam um conjunto recursivo> visto que a categoria S inicialmente expandida vai reaparecer na ex pansão da categoria VP, a qual é por sua vez o resultado da expansão de S. As regras (24ii) e (24v) apresentam a mesma propriedade relativamente às categorias NP e PP. A importância teórica de um sistema de regras recursivo consiste no facto de este poder aplicar-se um número de vezes indefinido, permitindo a construção de expressões indefinidamente longas, em que uma dada categoria ocorre reiteradamente. Apresentam-se dois exem plos em (33): (33) a. [s o João acha [s (que) o Manuel pensa [s (que) o Miguel disse [s (que) ... [s o general interrogou os prisioneiros]]]]] b. [Np o tio [pp d [w o amigo [pp d o pai [pp d | , o irmão ... [pp d ^ o João]]]]]]]]] interrogou os prisioneiros A recursividade permite que uma gramática gere um número infinito de expressões através de um conjunto finito de regras. De facto, é sempre possível, através da aplicação das regras apropriadas, substituir ... em (33) por mais uma realização da categoria S ou PP, obtendo uma nova expres são, sem limitações impostas pelo sistema da competência (mas com limitações processuais óbvias, devido à capacidade finita dos vários siste mas psicológicos que integram a performance, como a memória, a aten ção, o tempo disponível para a produção linguística, etc). A recursividade é um dos factores que explica o facto de a linguagem humana ter um escopo ilimitado relativamente à expressão de pensamentos (contrariamente a ou-) lros sistemas de comunicação animal).
6. Funções gramaticais A calegorização estrutural dos constituintes ffásicos (em NP, VP, PP, etc.) distingue-se da função, ou relação, que estes desempenham na frase (sujeito, objecto directo, etc.). A necessidade de reconhecer esta distinção é facilmente verificável através da consideração das seguintes frases: (34) a. b. c. d.
[0 [O Eu Eu
vagabundo] assaltou [o meu vizinho]. meu vizinho] assaltou [o vagabundo]. ofereci um papo-seco a[o meu vizinho]. ofereci um papo-seco a[o vagabundo]. 78
S
(29)
VP
NP
V
NP
S
(30)
S
(31)
D
N
S
(32)
VP
NP
I interrogou
D o
general
Qualquer das expressões o vagabundo e o meu vizinho pode ocupar a posição pré-verbal___V X, a posição pós-verbal X V___ ou a po sição pós-preposicional X P __ (X representa aqui uma variável sobre qual quer sequência de itens lexicais). Quando duas ou mais expressões podem ocorrer nos mesmos contextos linguísticos, dizemos que têm a mesma distribuição. Neste caso concreto, explicamos a idêntica distribuição das expressões o vagabundo e o meu vizinho através da sua atribuição à mesma categoria gramatical NP, e construímos a gramática de modo a que a distribuição das expressões seja sensível à sua categorização grama tical. 79
Por outro lado, estas expressões têm um comportamento diferente segundo a posição que ocupam na estrutura frásica. Assim, cm (34a), a con cordância verbal é com o NP o vagabundo e nflo com o NP o meu vi zinho; a forma pronominal o pode substituir este itltimo NP em (34a), mas não em (34b,c). O NP (a)o vagabundo pode ser substituído pela forma pronominal lhe em (34d), mas não em (34a,b). Caractcri/amos estas diferenças dizendo que os NPs desempenham funções gramaticais distintas (as quais dependem da sua posição na frase) e formulando a concordância e a substituição pronominal de modo a serem sensíveis a estas funções. Assim, a concordância é com o NP sujeito da frase, a for ma pronominal o substitui um NP com a função de objecto directo, e a forma pronominal lhe substitui um NP com a função de objecto indi recto. Na gramática generativa-transformacional, as funções gramaticais são definidas a partir das posições estruturais que as categorias gramaticais (NP, VP, PP, etc.) ocupam na frase (especificamente, em termos da categoria que as domina imediatamente). Apresentamos a seguir as definições de su jeito, objecto directo, objecto de preposição e predicado: (35) Sujeito 0 NP imediatamente dominado por S
[NP, S]
Objecto (Directo) 0 NP imediatamente dominado por VP
[NP, VP]
(37) Objecto da Preposição W 0 NP imediatamente dominado por PP contendo a preposição W
[NP, PP]
(36)
(38) Predicado 0 VP imediatamente dominado por S
[VP, S]
À direita de cada definição, escrevemos a notação convencional utili zada para a representar. Assim, por exemplo, a notação [NP, S] designa a categoria que funciona como sujeito da frase, e significa «o NP imediatameníe dominado por S»; [VP, S] designa o predicado de S, e deve ler-se «o VP imediatamente dominado por S», e assim sucessiva-
menle. A título de exemplo, consideremos de novo a frase (la) e a sua repre sentação estrutural (11), que repetimos aqui: (1) a. O mecânico limpou o automóvel com um pano. 80
(11)
s
um
pano
O N P o mecânico é o sujeito da frase ([NP,S]); o VP limpou o automóvel com um pano é o predicado da oração ([VP^S]); o NP o automóvel 6 o objecto directo ([NP,VP]); o NP um pano é objecto da preposição com ([NP,PP]). Algumas das funções definidas são reconhecidas nas gramáticas tradi cionais (sujeito e objecto directo, por exemplo). Outras, no entanto, não figuram em geral nessas gramáticas, como a de objecto de preposição. O que permite o seu reconhecimento na gramática generativa é precisamente o facto de as funções serem definidas estruturaimente, em termos de dominância imediata. Assim, qualquer categoria x imediatamente domina da por uma categoria y desempenha uma função gramatical relativamente a y ( S é portanto a única categoria que não desempenha uma função gra matical neste sistema, visto que não é dominada por nenhuma outra) (®). (?) Na gramática generativa, contudo, não é possível definir a função gramatical de objecto indirecto, pelo menos com o alcance que a gramática tradicional (e também a teoria da gramática relacionai) lhe atribui. Isto deve-se ao facto de existir um critério não posicionai na caracterização desta função. Considerem-se as seguintes frases: (i)
a. O Luís ofereceu um disco a[o Pedro]. b. A Joana sorriu a[o Pedro]. c. O João foi a[o cinema].
O NP o Pedro é (de acordo com a gramática tradicional) o objecto indirecto em (ia,b), mas o NP o cinema não é objecto indirecto em (ic), mau grado ocorrer no contexto da preposição a (na posição X í a]__ ). Este facto implica que não é possível definir a função de objecto indirecto unicamente em termos da definição da função de objecto de preposição, especificando W em (37) como sendo a. A gramática tradicional, como se sabe, propõe outro critério (não posicionai) para a caracterização desta função: a substi tuição do objecto da preposição a pelo pronome clílico lhe(s). Com este critério adicio nal, os dois NPs em (ia,b) obedecem à caracterização, mas não o de (ic):
81
7. A estrutura da frase As frases possuem uma estrutura mais complexa do que a simples divisão em NP e VP (sujeito e predicado). As orações subordinadas com o verbo no indicativo ou no conjuntivo (ver, por exemplo, (27d)) são introduzidas pelo item que ao qual ainda não atribuímos nenhuma posição sintáctica na estrutura da frase (,0). A flexão verbal, por sua vez, desempenha um papel importante na sintaxe da frase, o qual só é adequadamente caracte rizado se lhe atribuirmos um estatuto autônomo na estrutura sintáctica. Nesta secção discutimos estes aspectos da estrutura frásica.
7.1. A estrutura de S: a categoria Infl As frases podem ser caracterizadas através de uma tipologia baseada na estrutura morfológica da flexão verbal. A flexão verbal da grande maio ria das línguas apresenta marcas de acordo ou con co rd â n cia (em geral, mas nem sempre, com o NP sujeito da frase) e de tem po (n). A presença ou ausência destas marcas permite classificar as flexões verbais em quatro tipos (utilizamos uma notação em traços distintivos, com T = Tempo e Agr = = Acordo): (39) i.
[+T,+A gr] ií. [-T,-Agr]
iii. [+T,-Agr] iv. [-T, +Agr]i)(
(ii)
à. O Luís ofereceu-lhe um disco (ao Pedro). b. A Joana sorriu-lhe (ao Pedro). c. I O João foi-lhe (ao cinema).
Na gramática generativa, é evidentemente possível reconhecer informalmente a função de objeclo indirecto; no entanto, esta função não tem estatuto teórico no m odelo gram ati cal, visto que não é definida em termos exclusivamenle posicionais. ( I0) Sempre que uma estrutura frásica contiver dois nós S num a relação de subordi nação, empregamos a expressão «oração principal» para nos referirmos ao nó S subordinanle, e «oração subordinada» para nos referirmos ao nó S subordinado. Empregam os também por vezes o termo «oração» ou «oração simples» para nos referirmos a um a frase «sim ples» (isto é, sem uma estrutura de subordinação ou de coordenação). (M) Tam bém podem ocorrer marcas de modo, com o em Português, em bora menos frequentem ente.
82
As flexões com marcas temporais ((39i,iii)) são chamadas finitas. Dizemos também que o verbo que suporta essa flexão é finito, e que a frase que o contém é finita. Nas frases de (40), tanto as orações principais como as orações subordinadas são finitas: (40) a. O Luís escreve romances. b. O João disse-me [que o Luís enganou a Isabel]. c. Parece-me [que os miúdos não chegarão a tempo]. Em (40a), o verbo está no tempo presente (do indicativo); em (40b), tan to o verbo da oração principal (o verbo principal) como o da oração su bordinada estão no tempo passado (pretérito perfeito do indicativo); e em (40c), o verbo principal está no presente e o verbo subordinado no futuro (também do indicativo). As flexões sem marcas temporais ((39ii,iv)) chamam-se não-finitas (o verbo e a oração com uma tal flexão são não-finitos). Em (41), as ora ções subordinadas (assinaladas pelos parênteses) são não-finitas: (41) a. b. c. d.
Eu Eu Eu Eu
vi [os rapazes assaltar a loja]. vi [os rapazes assaltarem a loja]. vi [os rapazes assaltando a loja]. tive [a minha loja assaltada ontem à noite].
Seguindo a terminologia da gramática tradicional, as flexões não-finitas de (41a,b) são infinitivos propriamente ditos (infinitivo simples e infinitivo pessoal, respectivamente); em (41c), a flexão não-finita é um gerúndio; e em (41d) é um particípio passado (passivo) (12). No decorrer deste livro, restringimos a nossa discussão às flexões finitas e infinitivas propriamente ditas (n). Tanto as flexões finitas como as infinitivas podem em princípio ser marcadas positivamente ou negativamente quanto ao acordo com o sujeito da frase (em Português, tal como em muitas outras línguas, acordo em pes soa e número). Estas opções, contudo, não possuem o mesmo estatuto na Gramática Universal. Existem duas opções não marcadas, [+T, +Agr], e [-T, -Agr]. As outras combinações são raras, e constituem opções marca(,2) Em Português, as conjugações verbais formam um paradigma vasto e complexo, que não nos compete analisar aqui (ver qualquer gramática tradicional do Português, como Cunha e Cintra (1984)). Assinalamos apenas dois pontos: (i) as ffases simples (sem es trutura de subordinação) e as orações principais das frases com estrutura de subordina ção são em geral finitas, à excepção de certos casos especiais como comandos (nâo ma tar!); (ii) consideramos a forma roubado como sendo verbal embora apresente igualmente
83
dav Ou seja. na grande maioria das línguas, se uma flexfio verbal 6 fini ta. manifesta marcas de concordância, e se i infinitiva, nfto manifesta marcas de concordância. Ê este o caso do Inglês e da grande maioria dus línguas Românicas, como o Francês, o Espanhol e o Italiano, entre outras (,4). A opção (39iv) existe em Português, no fenômeno que u gramática tra dicional designa por «infinitivo pessoal» ou «flexionado» (ver, entre ou tros, Ali (1919), Maurer (1968), Sten (1952), Raposo (1973b; 1975; 1987a)). Nas frases de infinitivo pessoal, a flexão verbal não possui especificações temporais mas manifesta concordância em pessoa e número com o sujei to. Moriblogicamente, esta concord&ncia segue o morfema -r determinado pela opção [-T] das formas infinitivas (,s). As seguintes orações subordinadas exemplificam os três tipos de flexões verbais (finitas e infinitivas) que podem ocorrer em Português (l6): (42) a. Eu deixei que [as crianças lessem o livro] [+T, +Agr] b. Eu deixei [as crianças ler o livro] [-T, -Agr] c. Eu deixei [as crianças lerem o livro] [-T, +Agr] Embora as marcas flexionais de tempo e de concordância sejam morfologicamente realizarias como um sufixo verbal preso, a gramática gene rativa representa-as na estrutura frásica através de uma categoria autónopropriedades morfológicas de adjectivo, como o acordo em gênero e número. Os proble mas levantados por este tipo de acordo encontram-se fora do âmbito deste livro. 0 *123) Nas línguas Românicas, à excepção do Romeno, o infinitivo é expresso pelo morfema -r (amar, comer, ver). 0 4) A opção (39iii) parece ocorrer em línguas como o Chinês e o Japonês, que dis tinguem entre orações finitas e não-finitas, mas onde o verbo não manifesta morfologia de acordo com o sujeito ou com qualquer outro constituinte da oração (ver a este res peito, relativamente ao Chinês, Huang (1984)). (JS) Os morfemas de acordo no infinitivo pessoal português são os seguintes:
Singular 1 2 3
comer+tf comer+es comer+0
Plural comer+mos comer+des comer+em
Repare-se que as formas da 1.* e da 3.' pessoa do singular são idênticas à form a do infinitivo simples não flexionado. O reconhecimento desta homonímia m orfológica é importante para a compreensão da sintaxe do infinitivo em Português, sobretudo em com paração com as outras línguas Românicas. Ver, por exemplo, o fenômeno analisado bre vemente no capítulo 1, pp. 44-46. (" j Em Português, os verbos causativos como deixar, mandar e fazer, e os verbos de percepção, como ver e ouvir, admitem excepcionalmente estas três opções em varia ção livre.
ma chamada Flexão (abreviada em I ou Infl), separada do verbo ao qua) se encontra ligada na estrutura superficial da frase. Esta análise é motiva da pelo facto de Infl ser um elemento gramatical sintacticamenie activo, independentemente das outras categorias gramaticais da oração (nomeada mente do verbo) (l7). Nos modelos da gramática generativa pré-TRL, Infl é introduzido nas estruturas sintácticas como terceiro constituinte imediato de S, entre o NP sujeito e o VP. A regra categorial (24i) é assim substituída pela regra (43): (43) S ----- > NP Infl VP Esta regra dá origem à seguinte configuração sintáctica: (44)
S NP
Infl
VP
A composição de Infl em marcas de tempo e concordância é por sua vez especificada através da seguinte regra (em que a e p são variáveis sobre os valores + e podendo a ser igual a P): (45) In fl----- > [ocT, pAgr] Estruturalmente, Infl encontra-se mais próximo do NP sujeito da frase que dos complementos verbais (incluindo o NP objecto directo). Esta proxi midade estrutural corresponde à relação sintáctica privilegiada que Infl man tém com o sujeito, a qual se manifesta no fenômeno da concordância (,8).
7.2. A estrutura de S’: a categoria Comp As orações su b o rd in a d as declarativas finitas são necessariamente intro duzidas pelo item que. Na gramática generativa, os itens não adverbiais
(17) Infl corresponde ao constituinte AUX de versões anteriores da teoria generativa, como por exemplo, Chomsky (19S7; 1963), assim denominado por conter em Inglês os verbos auxiliares modais (can, must. shall, will, etc.) para além das marcas de tempo e concordância verbal. (18) A análise abstracta representada em (44) (com Infl precedendo o VP e logo o verbo no qual se realiza eventualmente como sufixo) tem de ser convertida na sequência de superfície V-Infl no decorrer da derivação das frases. É, pois, necessário que a gramática possua um mecanismo sintáctico que efectue essa conversão. Esse mecanismo tem toma85
que Uttroduxem orações subordinadas (como que e se nas línguas romlnl* ouk that e whether em Inglês, etc.) são chamados vnmplementadonu (Qomp).
Estrutunümcntc. a categoria Comp é introduzida como irml da cate* goria S. sendo ambas dominadas por um constituinte de tipo frásico, ao qual se dá o nome de S-barra, e se simboliza como S' (a razlo de ser desta nomenclatura e deste símbolo tom«r-$e*á clara no capítulo 6). Esta análise, devida a Bresnan (1970; 1972), implica que o símbolo axiomático do sis tema gramatical deixa de ser S, passando a ser S \ A primeira regra cate*
gorial da gramática é pois a seguinte: (46) S* ----- ->Comp S Chomsky (1973) propõe que a distinção entre as orações declarativas e as orações interrogativas seja representada através de uma diferenciação inter na da categoria Comp. Assim Comp pode ser [+WH] (Comp interrogati-1 vo) ou [-WH] (Comp declarativo). Estes traços são introduzidos através de uma regra de reescrita (entendendo-se que em (47) apenas um dos valores + ou - é escolhido na derivação de uma frase concreta): (47) Comp----->[+ WH] A estrutura de uma frase interrogativa como (48) é pois (49) (em (49) ‘ e (52) representamos o verbo na sua forma temática): (48) A Maria saiu? O Comp [-WH] de uma oração subordinada declarativa finita contém obri gatoriamente o complementador que: j 0 L»ís Cyp pensa k U * U h 9®]] U 0 general caiu]]]. O Comp [+WH] de uma oração subordinada interrogativa global finita contém o complementador se (19):
do â form ade uma regra transformacional de movimento, havendo duas possibilidades: ou Infl «desce» para V; ou V «sobe» para Inflí Voltamos a esta questão no capítulo 7. (>*) Vçr ò capítulo 4 para uma análise das orações interrogativas parciais (adverbiais e pronominais').
86
(51) O Luís [vr perguntou
seJJ (f o general tinha caídojjj.
O estatuto de S' como símbolo axíomático implica que as frases per" tencem agora à categoria S’ (incluindo as orações dedarativas principais). Assim, por exemplo, a análise da frase (27b) o prisioneiro cantou é agora aquela representada em (52). Assumímos pois que a categoria Comp se en contra sempre síntacticamente presente, embora possa não ser preenchida por um complementador realizado foneticamente (*). (49)
S’
(52) Cómp
[-WH]
o prisioneiro
Infl
VP
p?fl +Agr|
V
I
|
canta-
Êj (*?) Sempre que não seja pertinente para a discussão em curso, omitimos de aqui em diante a representação de Infl e de Comp, para não sobrecarregar as representações
lÉ
Capítulo 3
O léxico e a noção de subcategorização
1. O léxico O léxico é a componente do modelo gramatical onde se encontram as informações de natureza fonológica, sintáctica e semântica sobre os itens lexicais individuais. Podemos dizer que o léxico é o dicionário da gramática: as regras desta manipulam os itens lexicais, fazendo tsm uso crucial da informação aí contida. O léxico é assim uma parte central de qualquer teo ria gramatical (')• O léxico é o repositório das propriedades dos itens lexicais que não podem ser derivadas a partir das regras da gramática, tanto as proprieda des de natureza geral que servem para integrar os itens em classes (a soa categoria gramatical, a sua classe semântica em termos de características como [animado], [concreto], etc.), como aquelas, mais idiossincráticas, que caracterizam apenas um item ou um pequeno número de itens da Mngua. Um exemplo deste último tipo é dado pelo substantivo calças (e outros pertencentes ao mesmo campo semântico). Este nome ocorre sempre for malmente no plural, preferencialmente precedido pela expressão p ar de, mesmo quando a sua extensão é singular. (1) a. * O Luís comprou uma calça. b. O Luís comprou umas calças. c. O Luís comprou um par de calças. d. ? O Luís comprou duas calças. e. O Luís comprou dois pares de calças.
(') Este estatuto reflecte-se no facto de diferentes teorias gramaticais assumirem léxi cos com uma organização interna diferente e com um pape! diferente no funcionamento global da gramática. 89
A lcxia fato de banho (que pertence ao mesmo campo semântico) nflo está no entanto sujeita a esta idiossincrasia (o asterisco cm (2b,c) indica que estas expressões não podem receber uma interpretação singular para lela a (lb,c)): (2) a. O Luís comprou um fato de banho. b. * O Luís comprou uns fatos de banho. c. * O Luís comprou um par de fatos de banho. O léxico tem pois de indicar, por um lado, que o nome calças, e outros pertencentes ao mesmo campo semântico, têm as propriedades acima indi cadas; e por outro lado que a lexia fato de banho, embora pertencendo a esse campo semântico, não apresenta essas propriedades. Em Português europeu, os nomes próprios de pessoa (quando usados referencialmente) são obrigatoriamente precedidos de um artigo definido: (3) a. O Pedro comeu a maçã. b. * Pedro comeu a maçã. O léxico tem pois de representar esta informação. Como todos os nomes próprios se encontram submetidos a este comportamento, a informação pode ser representada através de uma regra de redundância e não precisa ser indicada em todas as entradas lexicais particulares (2).
2. O fenômeno da subcategorização 2.1. A subcategorização verbal Consideremos agora os verbos arrum ar e pôr, os quais possuem um significado e um comportamento sintáctico bastante semelhante, mas não idêntico. Ambos os verbos ocorrem obrigatoriamente num VP com um
H Os nomes próprios de personagens históricos (especialmente quando designados no contexto de um discurso literário ou histórico relativamente formal) não requerem (não permitem, para alguns falantes) um artigo definido: (i) a. ?? 0 Napoleão perdeu a batalha de Waterloo. b. Napoleão perdeu a batalha de Waterloo. Esta informação tem de ser incluída lias entradas lexicais relevantes como uma excepção a regra de redundância geral. 90
objecto directo. O verbo pôr, no entanto, ocorre obrigatoriamente num VP com um constituinte de categoria PP, ao passo que o verbo arrum ar admite, mas não requer, tal constituinte: (4) a. O Paulo pôs o livro na estante. b. * O Paulo pôs o livro. c. * O Paulo pôs. (5) a. O Paulo arrumou o livro na estante. b. O Paulo amimou o livro. c. * O Paulo arrumou. A entrada lexical do verbo arrum ar tem pois de especificar que este item ocorre obrigatoriamente com um NP mas apenas opcionalmente com um PP; ao passo que a entrada lexical de pôr tem de especificar que este item ocorre obrigatoriamente com um NP e com um PP, não podendo este último estar ausente do VP. Este fenômeno ilustra o importantíssimo fenômeno da subcategorização, o qual desempenha um papel crucial no aparelho teórico da TRL. Cada verbo particular é sensível à composição categorial do VP em que ocorre. Visto de outro modo, cada verbo «escolhe» a categoria gramatical dos cons tituintes com os quais pode, não pode, ou deve ocorrer no interior do VP. A diferença entre arrum ar e pôr é um exemplo. Consideremos outros ca sos. O verbo abrir ocorre obrigatoriamente com um NP (objecto directo): (6) a. O Luís abriu [a lata de amêijoas]. b. * O Luís abriu. O verbo jogar, pelo contrário, não pode ocorrer com um NP objecto di recto, embora ocorra com um PP (iniciado pela preposição a): (7) a. | Ontem, o Manel jogou [o futebol], b. Ontem, o Manel jogou [ao futebol]. O verbo optar admite um PP contendo a preposição por, não admi te um NP objecto directo, e pode igualmente ocorrer sozinho dentro do VP (3):
(3) A preposição por | o artigo definido a contraem na forma pela; como notámos antes, abstraímos aqui deste tipo de processos, que pertencem | morfologia.
91
(t)
«. O estudante optou [por a linguística]. b. O estudante já optou. c. * O estudante optou [a linguística].
O verbo preferir (semanticaraente muito próximo de optar) nlo admite um PP, admite um NP objecto directo, e nlo pode ocorrer sozinho dentro do VP: (9)
a. O estudante preferiu [a linguística]. b. * O estudante já preferiu. c. * O estudante preferiu [por a linguística].
O verbo trabalhar pode ocorrer isoladamente dentro do VP, mas não pode ocorrer com um NP (*): (10) a. O Manel não trabalhou. b. * O Manel não trabalhou as suas lições. Outros verbos ainda, como ler, admitem um NP objecto directo facultati vamente: (ü )
a. O José não lê. b. O José não leu esse livro.
A categoria AdvP também pode ser objecto da escolha verbal (ainda que esta situação não seja frequente). Este é o caso, por exemplo, do verbo com portar-se: (12) a. * O Vasco comportou-se. b. * O Vasco comportou-se [um horror]. c. O Vasco comportou-se [horrivelmente mal]. Aos constituintes «escolhidos» por um verbo e que co-ocorrem com ele dentro do VP chamamos complementos (verbais). Os complementos de um verbo completam o seu significado, e são em geral obrigatórios. Quando são omitidos, podem verificar-se duas situações: (i) ou a significação in trínseca do verbo não é completamente expressa e a frase não é gramati cal (cf. (4b,c), (5c), (6b), (9b), (12a)); (ii) ou a significação intrínseca do (*) A menos que esse NP seja «cognato», designando no caso de trabalhar uma matéria: (I) O carpinteiro trabalha a madeira. 92
verbo é cxprc«8a, e o complemento ausente é interpretado de modo «su bentendido», com uma significação genérica ou canônica, talvez cultural* mente fixa (cf, (5b), (8b), (11a)) (*), Concluímos pois que cada verbo tem uma «impressão digital» particu lar relativamente à categoria gramatical dos complementos com os quais pode ou deve ocorrer dentro do VP. A esta impressão digital chama-se quadro de subcategorização', os complementos que pertencem ao quadro de subcategorização de um verbo dizem-se subcategorizados por esse ver bo (inversamente, cada verbo subcategoriza os seus complementos) (6). As observações feitas sobre os verbos arrumar, pôr, abrir, brincar, jo g a r, ler, op tar, etc., podem agora ser reformuladas em termos do con ceito de subcategorização. Assim, arrumar subcategoriza obrigatoriamente um NP e facultativamente um PP com uma preposição locaüva (em, so bre, etc.). P ô r subcategoriza obrigatoriamente um NP e um PP com pre posição locativa. A b rir subcategoriza obrigatoriamente um NP; optar sub categoriza facultativamente um PP com o núcleo preposicional por, e assim sucessivamente. Um verbo pode ter um quadro de subcategorização nulo, isto é, não subcategorizar nenhum tipo de complemento. É o caso, por exem plo, de verbos como tra b a lh a r ou r i r (13) a. Ele não trabalha, b* O Luís riu. Um verbo que subcategoriza um NP (objecto directo) chama-se tran independentemente de subcategorizar ou não outro tipo de comple mentos. Um verbo que não subcategoriza um NP (objecto directo) chamase intransitivo, também independentemente de subcategorizar ou não outro., tipo de complementos. Verbos como arrumar, pôr, ler, escrever, preferir, são transitivos; verbos como optar, brincar, cair, trabalhar, ocorrer, rir, são intransitivos C7). sitivo.,
.. . (5) Por exemplo, com o verbo comer, como em o João já comeu, o objecto é en tendido normalmente como designando o que se come numa das refeições; em (5b), subentendemos um complemento locativo interpretado como «lugar genérico de arruma ção de livros», como estante, armário, etc. Voltamos à questão da interpretação destes complementos nulos no capitulo 11.4. (-) Note-se que a subcategorização diz respeito à categoria gram atical dos comple mentos, e não às suas propriedades semânticas (voltamos a esta questão no capitulo 9). O Muitos verbos intransitivos podem excepcionalmente tomar um NP objecto direc to pleonástico (a criança chora lágrimas de mimo) ou cognato (de viveu uma vida triste) (os exemplos são de Lapa (sem data)). As gramáticas tradicionais não são total mente consistentes nas definições de transitividade e intransitividade que apresentam. Assim, um verbo transitivo é por vezes definido com um verbo que toma qualquer tipo de 93
Os verbos que subcategorizam orações subordinadas de categoria S ' de terminam igualmente se esta é declarativa ou interrogativa (ou seja, |±WH|), Assim, verbos como perguntar e inquirir subcategori/am um S * com a categoria Comp especificada em (+WH); verbos como d e c la ra r, pen sar c querer subcategorizam um S‘ com a categoria Comp especificada em (-WH); e verbos como im aginar e saber subcategori/am ambos os tipos de S \ Vejam-se os seguintes exemplos ilustrativos: (14) a. Ele perguntou [s. (+WH se] (s a Maria vinha jantar]], b. * Ele perguntou [s. | ^ que] [s a Maria vinha jantar]]. (15) a. Ele declarou [s. [ WH que] [s a Maria vinha jantar]], b. * Ele declarou [s. ^ se] [s a Maria vinha jantar]]. (16) a. b.
Ele sabe [s. Ele sabe [s.
que] [s a Maria vem jantar]], se] [s a Maria vem jantar]].
2.2. Estatuto do sujeito relativamente à subcategorização Um aspecto importante da subcategorização verbal diz respeito ao esta tuto do sujeito da frase. O NP sujeito não é subcategorizado, visto que os verbos não escolhem a presença ou a ausência de um NP nesta posição. O NP sujeito é sempre obrigatório nas orações, seja qual for o verbo (8). Estruturalmente, a categoria VP desempenha um papel fundamental na formalização desta assimetria entre o sujeito e os complementos relativa mente à subcategorização. Os elementos subcategorizados pelo verbo ocorrem dentro do VP e são imediatamente dominados por ele, mantendo portanto a relação de irmão com o verbo que os subcategoriza. O NP sujeito, pelo contrário, não é subcategorizado pelo verbo, e ocorre fo ra do VP. Este facto
complemento, seja ele directo ou preposicionado. A definição que adoptamos aqui (den tro da tradição da gramática generativa) é mais restritiva: um verbo transitivo é aquele que subcategoriza um NP não preposicionado; inversamente, um verbo intransitivo é aquele que não subcategoriza um NP não preposicionado (incluindo portanto aqueles que não subcategorizam nenhum complemento bem como os que subcategorizam unicam ente com plementos preposicionados, como optar). (*) Esta conclusão é por vezes posta em causa relativamente aos verbos impessoais como constar, aos verbos meteorológicos como chover ou aos verbos semi-impessoais como parecer. No entanto, veremos no capítulo 9.8.2. que estes verbos tomam na reali dade um NP sujeito, embora este não domine nenhum material lexical em línguas como o Português. 94
desempenha um papel importante no funcionamento do modelo gramatical. Podemos dar-lhe uma formulação explícita através do seguinte princípio: (17) Principio da subcategori&ição Um constituinte é subcategorizado por um verbo sse é imediatamente dominado pelo VP que domina imediatamente esse verbo (isto é, sse é irmão do verbo). O princípio (17) é formulado como uma dupla implicação: não só um cons tituinte subcategorizado é imediatamente dominado pelo VP, mas também um constituinte imediatamente dominado pelo VP é necessariamente sub categorizado. Por outras palavras, o VP é o lugar dos constituintes subcategorizados e de mais nenhuma categoria frásica (*).
2.3. Subcategorização por outras categorias Não são apenas os verbos que possuem um quadro de subcategoriza ção. Todas as categorias lexicais podem subcategorizar complementos. As preposições, por exemplo, subcategorizam obrigatoriamente um constituinte de categoria NP ou de categoria S’: (18) a. A Maria comprou o jogo para [NT a Alexandra], b. A Maria comprou o jogo para [s, a Alexandra brincar], A maioria dos adjectivos não subcategoriza complementos (alto, gordo, esfomeado, etc.). Alguns, no entanto, subcategorizam facultativamente um constituinte de categoria PP (como fiel, contente), ou um constituinte de categoria S’ (como desejoso):
' (9) Existem determinados constituintes que ocorrem à direita do verbo (tal como os complementos verbais) mas que não fazem parte do seu quadro de subcategorização. Este é o caso, por exemplo, dos constituintes de significação adverbial locativa (de lugar onde) ou temporal (os exemplos são de Raposo (1978, capítulo 5)): (i) a. O João acompanhou a Maria ao cinema ao cair da tarde. b. O Ernesto leu um livro do Eça dentro da banheira. Em Raposo (1978, capítulo 5) apresentam-se vários argumentos de que estes constituin tes não são subcategorizados. De acordo com o princípio (17), não pertencem pois ao VP. Em Raposo (1978), propõe-se uma análise segundo a qual se encontram dominados directamente pela categoria S, tal como o NP sujeito. Voltamos a esta questão no capítu lo 7.2.1. 95
(19) a. A Maria é fiel [w ao Luís]. b. O Luís está contente [pp com o seu íllho]. c. O Luís está desejoso [s, que a Maria chegue]. Note-se que o adjectivo desejoso deriva do verbo desejar, que subcatego* rixa igualmente S \ Este facto não é acidental, como veremos mais adiante. Nomes como livro, caderno, mesa, João, não subcategorizam complemen tos. No entanto, nomes relacionais como autor, história, fotografia, sub categorizam complementos. Naqueles casos em que o nome deriva de um verbo, subcategoriza os complementos correspondentes aos do verbo (veja-se o paralelismo entre (20b) e (20c)) (,0): (20) a. O autor [desse livro] deu uma sessão de autógrafos. b. A atribuição [dar prêmios] [aos candidatos] foi ontem. c. Ontem, o júri atribuiu [os prêmios] [aos candidatos].
3. O formato do léxico 3.1. As entradas lexicais O léxico consiste num conjunto (não ordenado) de entradas lexicais. Cada entrada lexical contém a informação pertinente de natureza fonológica, smíácfica e semântica sobre o item lexical que representa. No que respei ta à sintaxe, as entradas lexicais contêm minimamente uma informação de natureza categorial (isto é, a categoria sintáctica a que um dado item per tence) e uma informação relativa ao quadro de subcategorização do item. Apresentamos a seguir as entradas lexicais dos verbos arrum ar, abrir, optar, escrever, trabalhar, perguntar, declarar, da preposição para, e dos adjectivos alto e fiel. a. arrumar,;
v>.. _ _ NP ([„ Pl0c NP]) V, NP Q optar. *'V, ■ B B por NP]) 4. escrever. V, ___ (NP) ( |„ a NP]) e. trabalhar. 1115
n abrir.
í*0) G complemento os prêmios é necessariamente precedido pela preposição de com o nome atribuição, mas não com o verbo atribuir. Voltamos a este facto no capí tulo 1296
f. perguntar. V,
jíppPorNP] —
a NP]) ■
I(Is.+WHJ g. declarar.
V,
—
(U a NP]) [,-WH] í NP
(22) para:
\
P,
^ljri;-,(23); a . A, A, , - I Z í ^ a N P D b. fiel:?>. As informações categorial e subcategorial encontram-se separadas por uma vírgula. Na informação subcategorial, o travessão (___) indica a po sição do item lexical relaüvamente aos seus complementos. Os parênteses curvos indicam que o constituinte encerrado é facultativo no quadro de subcategorização do item; e a chaveta indica que os elementos dentro dela se encontram em disjunção exclusiva: um deles pode ocorrer, mas não am bos. No caso em que o constituinte subcategorizado é um PP, o item subcategorizador determina igualmente a preposição específica do PP ou, como no caso de arru m a r, uma classe específica de preposições (aqui, a classe locatign), i Se o. constituinte subcategorizado é S \ o item subcategorizador determina igualmente se esse S’ é [+WH] ou [-WHJ. Incluímos pois essas informações no quadro de subcategorização, daí decorrendo a notação ligeiramente diferente nos casos em que a categoria subcalegorizada é um PP ou um S’. Quando um item possui dois ou mais complementos, a ordem em que estes ocorrem no quadro de subcategorização corresponde à ordem canônica em que ocorrem dentro do VP. Finalmente, repare-se na notação empregada no caso de itens lexicais cujo quadro de subcategorização é nulo C aie) e (23a)). Os quadros de subcategorização contêm dois tipos de informação cuja distinção é crucial na TRL. Primeiro, a informação de que um item subcategoriza um determinado número de posições sintácticas no VP; segun do, a informação de quais as categorias gramaticais que preenchem essas posições sintácticas. Podemos avaliar esta distinção considerando verbos como perguntar ou chamar, ou a preposição para, onde estes dois as pectos se distinguem. Estes itens subcategorizam uma posição sintáctica obri gatória (perguntar subcategoriza adicionalmente um PP opcional com a 97
prrposiçio a), a qual, no entanto, pode ser preenchida em ultemutivii por tinia de duos categorias sintácticas diferentes. No quadro de suhcntegori* ração. essa situação é indicada através de uma chaveta. Como exemplos, vejam-se (18) e as seguintes frases: (24) a. O Mane! perguntou (ao Luís) I,.,, pelo Miguel], b. O Manel perguntou (ao Lufs) (,. se o Miguel estava na praia]. (25) a. Eu chamei (KT o João] b. Eu chamei [„, pelo João] Os seguintes exemplos mostram que as categorias em competição para uma dada posição sintácüca não podem co-ocorrer dentro do VP: (26) a. * A Maria comprou o jogo para [a Alexandra] [a Alexandra brincar]. b. * O Manel perguntou ( ao Luís) [pelo Miguel] [se o Miguel estava na praia]. c. * Eu chamei [o João] [pelo Luís]
3.2. A hipótese Íexicalisía Consideremos os paradigmas seguintes: (27) a. Eles [w atribuíram os prêmios] [pp aos candidatos]]. b. Ejj» A atribuição [^ (djos prêmios] [pp aos candidatos]] foi ontem. (28) a. Eles [w desejam L, que a Maria chegue cedo]]. b. | | O desejo [. (de) que a Maria chegue cedo]] (é partilhado por todos.) c, Eles estão desejosos [ (de) que a Maria chegue cedo]]. Como notámos acima, p. 96, exs. (20 b,c)) as propriedades de subcategorização de itens relacionados por regras da morfologia derivativa são frequentemente idênticas. Nas primeiras versões da gramática generativa, a relação entre as frases dos paradigmas (27) e (28) era descrita através de regras transformacionais de «nominalização» ou de «adjectivalização», que convertiam a estrutura subjacente às frases (27a) ou (28a) nas estrutu ras correspondentes às expressões nominais ou adjectivais. Chomsky (1970) mostrou no entanto que tais regras são incompatíveis com uma teoria res98
tritiva d u regras tranaformacionait, c propõi uma análise diferente, a qual ficou conhecida sob o nome de «hipótese lexicalista». Concretamente, Chomsky propôs que os itens relacionados são carac terizados no léxico através de uma única entrada lexical com um quadro de subcategorízaçâo fixo, e com uma especificação neutra quanto à infor m ação categoria!. Assim, por exemplo, o item atribui- é caracterizado pela seguinte entrada lexical categorialmente neutra (” ):
(29) a t r i b u i [aN , 0V],
___NP
a]
Se a informação categoríal é especificada como [-N,+V1, o item é inseri do sob um nó sintáctico de categoria V; se a informação categoria] é especificada como [+N,-V], o item é inserido sob um nó sintáctico de ca tegoria N (sobre a regra de inserção lexical, ver a secção 4). Nesta análise, portanto, nenhuma regra transformacional relaciona as duas formas. A derivação morfológica das formas lexicais relacionadas (por exem plo, de atribuição a partir de atribui), é feita por regras morfológicas in tegradas no léxico, as quais adicionam sufixos às formas de base, especi ficando a categoria gramatical dessa forma de acordo com a natureza do sufixo adicionado. É apenas depois da aplicação destas regras que as pa lavras são inseridas na estrutura sintáctica das orações. Por exemplo, a forma a trib u içã o é derivada a partir da forma básica atribui- através da adição do sufixo -ção, o qual especifica que a forma resultante é um Nome. Esta forma é a seguir inserida na estrutura sintáctica através da regra de inser ção lexical (12). Certos linguistas (como, por exemplo, Anderson (1982)) interpretam a hipótese lexicalista através do postulado de que as regras da sintaxe não têm acesso (isto é, não podem fazer referência) à estrutura interna das pa lavras. Por exemplo, nenhuma regra sintáctica é sensível ao facto de a tri bu ição consistir num a raiz a trib u i- e no sufixo -ção. Esta concepção é uma consequência do facto de os itens lexicais morfologicameníe complexos serem introduzidos nas estruturas sintácticas já completamente form ados (isto é, depois de derivados pelas regras da morfologia), no pressuposto de que as (") Em (29), a e p são variáveis sobre os valores + e com a condição de que a e | têm valores necessariamente opostos. Assim, se o valor de [V] é +, o de [N] é -, e vice-versa. Repare-se que fazemos aqui um uso crucial do facto de as categorias lexicais principais serem combinações de traços distintivos categoriais (ver o capítulo 2.2.2.). Note-se de novo que o facto de o objecto directo verbal do nome corresponder a um PP (com a preposição de) recebe uma explicação independente (ver o capítulo 12.4.1.). H Para uma exposição detalhada da hipótese lexicalista e das regras de formação de palavras do léxico, ver AvonofF (1976). Relativamente ao Português, ver Mateus et al., 1989, capítulo 17). 99
H |B * da sintaxe são «autônomas», isto é, nâo lém capacidade de «olhar» pan to operações internas de outra componente da gramática, neste cano, O WXKM
Utua distinção importante para a hipótese lexienlista e a diferença entre motfobgUt derivavional e morfologia flexionai. A primeira constrói pala* vras novas (muitas vezes de categoria gramatical diferente) através da com* posição de uma forma base com um afixo (por exemplo, nacional através da composição de nação (ou da forma básica. abstracta, naclon-) com o sufixo -al, ou atribuição através da composição de atribui- com o sufixo -ção). A segunda caracteriza a relação existente entre formas diferentes da mesma palavra, como por exemplo a relação entre as formas de um dado verbo (organizadas numa conjugação verbal), ou de um dado nome (orga nizadas numa dec linação nominal). A hipótese lexicalista de Chomsky (1970) diz respeito apenas às formas relacionadas através da morfologia derivacional. As relações flexionais (ou pelo menos um conjunto importante destas, como a relação entre um verbo e a sua flexão de tempo/acordo), pelo contrário, sempre foram concebidas como pertencendo inteiramente ao domínio da sintaxe. A flexão verbal (a categoria Infl postulada no capítulo 2.7.1). por exemplo, é uma categoria com um estatuto independente na estrutura sintácdca profunda das frases, e a sua combinação com uma forma verbal na estrutura de superfície é feita através de uma regra sintáctica (cf. o capítulo 7.6).
4. A inserção lexical O modelo gramatical desenvolvido até aqui contém um sistema de regras categoriais ((2.24) e (2.25), com (2.241) substituído por (2.43) e com (2.46) como primeira regra do sistema), e um léxico contendo informação categorial e subcategorial. A inclusão do léxico na gramática permite repensar radicalmente o modo como os itens lexicais são inseridos nas estruturas geradas pelas regras categoriais. O modelo resultante, como veremos, é con sideravelmente mais adequado do que aquele proposto no capítulo anterior. No capítulo 2 propôs-se que a inserção dos itens lexicais é feita atra vés de regras de reescrita ((2.25)) do mesmo tipo das que introduzem as categorias gramaticais. Essas regras, no entanto, levantam problemas des critivos sérios. Consideremos a título de exemplo a estrutura pré-terminal (isto é, sem itens lexicais) (30a), derivável a partir da aplicação das regras (2.43) e (2.24,ii,iii) (13). No sistema do capítulo anterior, não existem res-
(,J) Omitimos lnfl e Comp por nâo serem relevantes para esta discussão.
(30) H
o
Luís
abriu
trições sobre a aplicação das regras (2.25); isto é. para cada uma destas regras, qualquer item à direita da seta pode ser escolhido. Sendo assim, é possível derivar a estrutura terminal (30b) pela aplicação das re gras (2.25i,ii,vi). A expressão o Luís a b riu , no entanto, não é gramatical, visto que as propriedades de subcategorização do verbo a b rir não se encontram satis feitas. E fácil verificar que este problema se generaliza a todo o léxico: o modelo do capítulo anterior é completamente «cego» às propriedades de subcategorização dos verbos (ou de outros elementos lexicais), permitindo a geração de todas as expressões que não as satisfazem (por exemplo, para além de (6b), também (4b,c), (5c), (7a), (8c), (9b,c), (10b) e (12a,b) (M). A solução para este problema (desenvolvida pela primeira vez em Chomsky (1965)) consiste em abandonar completamente as regras (2.25) como mecanismo de inserção dos itens lexicais nas estruturas sintácticas. A gram ática categorial fica assim reduzida às regras (2.24), (2.43) e (2.46), produzindo estruturas sintácticas cujos elementos terminais são agora ca tegorias lexicais (N, V, P, etc.) e categorias menores com o D , Poss, etc., mas não itens lexicais. Em lugar das regras (2.25), introduzimos na gramática um mecanismo de inserção lexical directamente dependente da informação sintáctica presente no léxico, e aplicando-se imediatamente a seguir às regras categoriais (2.24):
(l4) De um modelo que gera estnituras/expressões para além daquelas que pertencem à língua diz-se que sobrtgera — do inglês «overgenerate». 101
(31)
M eca n ism o de inserção lexical
Inserir qualquer item do léxico sob um nó term inal de um u estrutura sintáctica, sujeito às duas condições seguintes: (i)
a inform ação categorial do item condiz co m a e tiq u e ta do nó sob o qual é inserido; (ii) o quadro de subcategorização do item c o n d iz c o m a com posição categorial da categoria sintagm ática q u e d om ina im ediatam ente o nó sob o qual o item é in se rid o . E xem plifiquem os o funcionam ento de (31) através da d e riv a çã o d e (6a) (e através do m odo com o se im pede a derivação de (6b)). A s re g ra s categoriais aplicam -se, gerando o «esqueleto» categorial (32a) (pelo m o d o des crito no capítulo 2.5). Sobre esta estrutura aplica-se o m e c a n ism o (3 1 ) (ta n tas vezes quantos os itens lexicais a inserir). A p rim eira c o n d iç ã o d e (31) determ ina que um item categorizado no léxico com o X a p en a s p o d e ser inserido sob um nó terminal de categoria X na estru tu ra sin tác tic a. A ssim , p o r exem plo, L u ís apenas pode ser inserido sob um nó N , o so b u m nó D , e assim sucessivam ente. A estrutura resu ltan te d e stas a p lic a ç õ e s é (32b) (deixam os o verbo por inserir) (I5). C onsiderem os agora a inserção do verbo, q u e ilu stra d ire c ta m e n te o fu n cionam ento de (31ii). O verbo a b r ir possui a e ntrada lex ic al (33): (33)
abrir. V,
___ NP
A in form ação categorial perm ite inserir a b r i r sob a c a te g o ria V e m (3 2 b ). A condição (31ii) requer que o quadro de su bcategorização d e a b r i r c o n diga c o m a com posição categorial im ediata d a categoria sin ta g m á tic a que d o m in a im ediatam ente V ___ ou seja, o V P (v e r o p rin c íp io (1 7 )). O quadro de subcategorização de a b r i r condiz com a c o m p o siç ão im e d ia ta d o V P de (32); Jogo, a inserção pode ser feita em (34): Suponham os agora que as regras categoriais geram (35), e q u e os itens o e L u ís são inseridos na estrutura (35). D e acordo com (31ii), o verb o a b r i r não pode ser inserido sob V em (35) po rq u e a c o m p o siç ão im e d ia ta
(15) O léxico contém igualmenle as flexões do paradigma verbal, caracterizadas atra vés das suas propriedades de Tempo e Acordo. Assim, por exemplo, a forma -u é carac terizada pela seguinte entrada: (i) -u: Flexão, [Pret. Perf., 3.‘ pessoa, sg.] Paia que a inserção lexical de um morfema ílexivo se possa efectuar, é necessário especificar nas estruturas o tempo específico, bem como a pessoa e número do acordo,
102
(32)
a.
s
P (32)
NP
b
D
N
o
Luís
[+T, +Agr]
I # ÍI ,I
V
ameijoas
1
lata
P
NP
I
I
de
N
amêijoas
103
do VP mio condi/ com o quadro de subcategorização de abrir. Consequen temente. (6b) não é gerado, exactamente o resultado que pretendemos atin gir* Es te modelo gramatical não sofre pois do problema de sobregeraçflo que caracteriza o modelo do capítulo anterior. Em síntese, o modelo gramatical construído até aqui contém três mecanismos distintos: a componente categoria !, formada pelo conjunto de regras categoriais (2.24), (2.43), (2.45), (2.46) e (2.47); o léxico ; e o me canismo de inserção lexical (31).
(35)
S
o que não fazemos aqui para não sobrecarregar as representações. Numa análise deste tipo, o verbo | inserido na sua forma temática (ou seja, radical + vogal temática). A partir do próximo capítulo, no entanto (salvo indicação explícita em contrário), e com o objeclivo de não sobrecarregar as representações, introduzimos o verbo na estru tura sintáctica directamente na sua forma flexionada, especificando apenas sob Infl as pro priedades [ t T] e [ + Agr]. Tal como as formas da flexão verbal, também os complementadores são representa dos no léxico através de entradas lexicais. 104
Capítulo 4
A regra Mover a
1. Regras de movimento, estratura-D e estrutura-S Um dos resultados centrais de Chomsky (1957) é o de que uma gramá tica constituída apenas por regras categoriais não pode explicar exaustivamente as relações de dependência entre constituintes em frases como (lb,c): (1) a. O Luís comprou os discos. b. Os discos foram comprados (pelo Luís). c. Que discos o Luís comprou? Nas frases de (1) existe uma relação de dependência entre o verbo com p r a r e o NP os discos (ignoramos nesta discussão o facto de o determi nante do NP em (lc) ser que e não os). Por exemplo, se omitirmos esse NP em (la,c), as expressões resultantes não são gramaticais ('):
(') Em Português, as expressões (2) e (3) podem receber uma interpretação em certas situações discursivas específicas, com um objecto identificado pragmadcamente pelos par ticipantes do discurso e funcionando como tópico deste (ver o cap. 113). Numa situação em que nenhum referente se encontra identificado pelo falante e pelo ouvinte. (2) e (3) não são gramaticais, porque lhes falta o NP objecto directo subcategorizado por comprar. A omissão do NP os discos é permitida em (lb) (foram comprados pelo Luís) porque o Português é uma língua de sujeito nulo (cf. o capítulo 16.3). No entanto, mesmo nes se caso, é necessário que haja um tópico discursivo ao qual o NP omitido se possa refe rir. A não gramaticalidade de expressões como (2) e (3) é transparente numa língua como
o Inglês, em que um NP não pode sei pragmaticamente recuperado: (i) a. * b. * c. *
Luís bought. Was bought (by Luís). Did Luís buy?
105
(2) * O Luís comprou. (3) * O Luís comprou? A relação de dependência entre comprar e os discos c facilm ente ca-
racterízável em (la), através do conceito
de subcategorização discutido no
capítulo 3. Assim, dizemos que este verbo subcategoriza um N P (objecto directo), e representamos esta informação na sua entrada lexical. E sta in formação, por sua vez, serve de base ao m ecanism o de inserção lexical. Se o VP contém um NP, o verbo é inserido; se o VP não contém um NP, a inserção do verbo é bloqueada (ver a discussão no capítulo 3). E m (la ), o VP contém um NP, e o verbo é correctam ente inserido. E m (lb ,c ), no entanto, o NP que satisfaz o quadro de subcategorização de comprar está fo ra do VP (na posição de sujeito em (1b) e num a posição «periférica» típica dos constituintes interrogativos em (lc )). Tal com o form ulado no capítulo 3, o mecanismo de inserção lexical deveria bloquear a inserção de comprar. O facto de estas frases serem gram aticais carece pois de explicação. A subcategorização exige um a relação estritam ente local entre a cate goria lexical e os seus com plem entos subcategorizados. E ssa relação é ca racterizada em termos da relação irmão: um constituinte satisfaz o quadro de subcategorização de um a categoria lexical se e só se é irm ão dessa categoria (cf. o princípio Aruv\ capítulos ao longo deste livro (para uma síntese, ver o capítulo A existência dos vestígios permite que o quadro de subcategorização de um verbo seja satisfeito não apenas cm estrutura-D (o nível de repre sentação que resulta da inserção lexical), mas também em cstrutura-S, já que os vestígios tomam este nível de representação estruturalmente e categorialmente idêntico à estrutura-D. Assim, por exemplo, o quadro de subcatcgorização de comprar é satisfeito na estrutura-D (13a) da frase (1b) pelo NP os discos e também na estrutura-S (13b) pelo vestígio NP, na posição originalmente ocupada pelo NP os discos. Este facto revelar-se-á de extrema import&ncia no âmbito do Princípio de Projecção da Teoria Temática (ver o capítulo 9.7).
3. Para uma tipologia das regras de m ovim ento Á estratégia de investigação da TRL relativamente à componente transformacional tem consistido na tentativa de reduzir as múltiplas regras de movimento dos modelos anteriores da gramática generativa a regras extre mamente simples, como M o v e r N P ou M o v e r wh. Cada uma destas regras é o resultado da generalização de determinadas transformações individuais de modelos anteriores. Assim, Mover NP engloba (entre outras) as trans formações Passiva e de Elevação do Sujeito; e Mover w h engloba (entre outras) as transformações de Relativização e Formação de Orações Inter rogativas, bem como a classe de regras que envolvem o movimento de um constituinte para a posição Comp. (Para um estudo detalhado de Mover w h e das regras particulares que substitui, ver Chomsky (1977a)). Contrariamente às regras transformacionais de modelos anteriores, as re gras da TRL não são afectadas por restrições particulares. Isto não signi fica, no entanto, que não obedecem a condições nenhumas. Significa sim que essas condições são de natureza de tal modo geral que são formula das como princípios universais independentes, permitindo assim que as regras se reduzam a uma forma exíremamente simples (8).(*)
(*) ,Esta formulação simples permite por sua vez dispensar a descrição estrutural e a modificação estrutural que intervinham na formulação das regras transformacionais em modelos anteriores da gramática generativa. O trabalho quer de uma quer da outra é agora realizado pelas condições universais que restringem as regras.
116
Uma outra diferença importante entre a componente tramformactonal da TKI. e a de modelo* generativo* anteriore* consiste na eliminação com pleta das regras de apagamento e inserção na componente transformacional da TRL, a qual contém apenas regraa de movimento (*)■ Uma das con trapartidas desta eliminação consiste, como veremos, na pottulação de um conjunto restrito de categorias vazias «emanticamente interpretadas. Na secção seguinte, discutímos algumas das propriedades de duas regras centrais na literatura da TRL, Mover NP e Mover wh. 3.1. Mover NP A regra Mover NP aplica-se na derivação das construções passiva e ele vação do sujeito exemplificadas em (17a,b) respectivamente:
(17) a. O queijo foi roubado (pela raposa). b. A raposa parece ter roubado o queijo. c. O queijo parece ter sido roubado (pela raposa). Nestas frases, o NP o queijo satisfaz os requisitos de subcategorização do verbo roubar. Na estrutura-D esse NP ocorre pois dentro do VP definido por esse verbo (ver a discussão na secção 1). A frase (17b), para além disso, contém o verbo parecer, que subcategoriza um complemento frásico (cf. a paráfrase de (17b) parece que a raposa roubou o queijo). Em (18a,b) damos a estrutura-D dos exemplos (17a,b), respectivamente O Em (18), as posições de sujeito ([NP, S]) dos VPs cujos verbos são ser e parecer, respectivamente, encontram-se vazias. O NP o queijo em (17a) é movido para a posição de sujeito de ser a partir da posição de objecto directo de roubar, deixando aí um vestígio co-indexado; o NP a raposa, por sua vez, é movido em (17b) para a posição de sujeito de parecer, deixan do igualmente um vestígio na sua posição de origem (a posição de sujeito da oração subordinada). Derivam-se assim as estmturas-S (19) dessas fra ses:
(9) Para uma aproximação de certo modo diferente, no entanto, ver Lasntk e Saito
(1984), e Lasnik e Uriagereka (1988). Ver também o capítulo 14.3.7. (10) Nfio nos preocupamos com a estrutura exacta do auxiliar ter, e simplificamos a representação incluindo-o sob o nó V, acompanhando o veibo principal roubado. 117
(18) a.
S
b.
S
V
I
parece
ter roubado m
m
i
118
Embora continuemos a falar das construções particulares «passiva» e «elevação», não se deve perder de vista que não existem regras transformacionais específicas paia cada uma delas: a regra pertinente é, em am bos os casos, Mover NP. Isto não significa que não existem diferenças entre as duas construções, mas sim que essas diferenças provêm de aspectos de cada uma delas que são independentes da regra de movimento. Levando este raciocínio até ao fim, diremos que a noção de «construção» da gramática tradicional (passiva, elevação, etc.) não tem nenhum estatuto teórico pri mitivo na TRL, na medida em que é sempre redutível a propriedades independentes dos elementos que ocorrem nas estruturas, e que podem (re) ocoirer em combinações diversas. Voltamos às propriedades das «constru ções» passiva I de elevação nos capítulos 10 e 12. A frase (17c) é uma combinação das construções passiva e elevação. Assim, Mover NP aplica-se duas vezes na sua derivação. A estrutura-D desta frase é dada em (20) (ver a nota 10). Mover NP aplica-se sobre (20) movendo o NP o queijo para a posição vazia de sujeito da construção passiva subordinada, derivando a estrutura intermédia (21). Sobre (21) aplica-se de novo Mover NP, que desloca o mesmo NP paia a posição vazia de sujeito de parecer, derivando-se assim a estrutura-S (22) de (17c). Repare-se que na estrutura-D (20), as duas posições [NP, S] principal e [NP, S] subordinada encontram-se vazias, prontas a acolher o NP movido. Na estrutura-S (22) existem dois vestígios, ambos co-indexados com o NP movido, cada um deles correspondendo a uma das aplicações da regra Mover NP. Se Mover NP não se aplicai- sobre as esüuturas-D (18a,b) e (20) obte119
iihv\ frases tftic sfió paráfrases de (17u,b,c), c cuja estrutura-S o (nos its {XJCtos relevantes) idêntica à sua estrutura-D:
(23) a. Foi roubado um queijo (pela raposa). b. Parece que a raposa roubou o queijo. c. Parece que foi roubado um queijo (pela raposa). Em (23), as relações de dependência lógico-semfinticas entre roubar,
parecer e os seus complementos respectivos é completamente transparente; em particular, o objecto directo lógico-semfintico o (um) queijo ocupa a posição canônica que serve para definir essa função ("). (20) S NP
VP V
S
parece
H ter sido I
roubado
o queijo
pela raposa
(") As orações de (23) diferem das de (17) também noutros aspectos. Assim, por exemplo, o NP pós-verbal de (23a) é indefinido em vez de definido; e as orações subor dinadas de (23b,c) são finitas em vez de infinitivas. Voltamos a estes pontos em capítulos posteriores. 120
(21) NP
* VP
A análise aqui apresentada da construção passiva difere em pontos subs tanciais da análise de modelos anteriores da gramática generativa. Em pri meiro lugar, nenhum item lexical desta construção é introduzido transformacionalmente: tanto o verbo (auxiliar) ser como a preposição por se 121
encontram desde logo na estrutura-D. Este aspecto da análise (o qual an tecede a TRL, ver por exemplo Chomsky (1977b, 7-8)) está de acordo com uma das propostas centrais da TRL quanto à componente transformadonal. a de que esta apenas contém regras de movimento. Em segundo lugar, o «agente da passiva» nfio é movido du posição de sujeito em estnitura-D para a posição interna ao VP que ocupa em estrutura-S (como na análise de Chomsky (1970)), mas ocupa essa posição logo desde a estrutura-D. Na TRL desaparece pois a regra transformacional de «PosposiçSo do Agente» de Chomsky (1970). O motivo que está na base da análise da TRL tem a ver com a teoria Temática, e é discutido no capítulo 10.4. 3.2. Mover wh Mover wh é a regra que move constituintes interrogativos ou prono mes relativos para uma posição periférica da frase nas orações interrogati vas parciais e nas orações relativas, respectivamente. Os constituintes movidos por esta regra — à excepção de onde e como — contêm ou consistem (n)um item cuja primeira letra é q- , e são por isso chamados constituin tes Q (constituintes WH em Inglês). Damos alguns exemplos a seguir, sublinhando os constituintes Q (12): (24) a. Que discos (é que) o Manel ofereceu à Maria? b. Com quem saiu a Joana? (25) a. Eu não imagino que discos o Manel ofereceu à Maria,
b. Ele não sabe com quem a Joana saiu. (26) a. Eu ouvi os discos que o Manel ofereceu à Maria, b. Eu não conheço o rapaz com quem a Joana saiu. Um constituinte Q pode ser um pronome (quem, que), um advérbio (onde, como), um NP (que discos, cujo pai, o qual), ou um PP (com quem, com que rapaz). Em (24), a regra aplica-se no âmbito de uma oração interrogativa directa; em (25), no âmbito de uma oração interrogativa in directa; e em (26) no âmbito de uma oração relativa. (li) Ignoramos aqui a inserção opcional de é que em (24a), bem como a necessária inversão entre o sujeito e o verbo em (24b). Para um estudo destes fenômenos no qua dro da TRL, ver Ambar (1988). Para um estudo das orações relativas no quadro da TRL, ver Brito (1988).
122
Bresnan (1972) propôs que o local de poiso, ou alvo, da regra Mover wh 6 a categoria Comp, a qual domina igualmente os complementado!» que e se nas orações subordinadas finitas (declarativas e interrogativas, respectivamente), como vímos no capítulo 2. (Chamamos /oco/ dc poiso, ou o/vo, à posição para a qual um determinado constiminte é movido por uma regra de movimento.) Nesta análise, a esíratura-D de (24a), por exemplo, é dada em (27). Nesta estrutura, a posição Comp [+WH] encontra-se lexi calmente vazia, pronta a acolher o constituinte Q movido. A estrutura-S de (24a) é a dada em (28): (27)
S’
Comp [+WH]
S NP o Manel
Infl
VP V
i
ofereceu (28)
NP
A
que discos
PP
A
a Mana
S’
(28), o constituinte que discos é movido para Comp, deixando um vestígio (co-indexado) na posição que ocupa em estrutura-D. Em (25), os constituintes Q são movidos para a posição Comp [+WH] da oração subordinada, visto que se trata de uma construção interrogativa indirecta, subcategorizada pelos verbos (não) saber e (não) imaginar. As
Em
123
Mtroiurns D o S de (25b). por exemplo, são as seguintes (n posição Comp '»/»» em (2 9 $ é simbolizada polo elemento identidade r): (2 NP S’ Dentro da oração relativa, existe um pronome relativo ou um constituinte Q contendo um elemento pronominal (com quem, em (26b)). Este pronome (ou constituinte) mantém uma relação de co-referência obrigatória com o antecedente da oração relativa (ver o capítulo 8 para uma elucidação do conceito de co-referência), e é movido da posição que ocupa em estrutura-D dentro da oração relativa para a posição Comp dessa oração. As es truturas D e S de (26b) são pois as seguintes: (31)
a. Eu não [vp conheço [NP [NP o rapaz] 1 [Comp [ WH e]] [s a Joana saiu com quem]]]]. b. Eu não [w conheço [w o rapaz] [s. [,WH [com quem],]] k a Joana saiu /,]]]].
A regra Mover NP pode apiicar-se sobre um dado constituinte Q na derivação de uma frase se esse constituinte for igualmente um pronome ou um NP, desde que Mover wh se aplique subsequentemente movendo o constituinte para Comp. Em (32a) as duas regras movem sucessivamen te o constituinte Q que discos. Em (32b) damos a estrutura-D desta frase, em (32c) a estrutura intermédia resultante da aplicação da regra Mo ver NP, e em (32d) a sua esírutura-S, resultante da aplicação da regra Mover wh: (32)
a. Que discos foram comprados pelo Luís? b- Cs- Ceo™, U b Cs Chp e] Iníl [vp foram comprados [NP que discos] pelo Luís]]] 124
C' U'
Kwt
(§ í*r
(* f], p e lo Lufijn
ínfl (
foram comprado*
d * l« írWflp Kwh fo * d* « P p í, U O , ínfl fvp foram comprado* \m í\t pelo Luí«j|J
Na estrutura-D (32b) a» poúçfct de sujeito e Comp para as quais o constituinte Q é sucessívamente movido encontram-se vazias. A estrutura-S (32d) contém dois veitígíos, cada um deles correspondente a um dos movimentos. O movimento de um constituinte Q através de Mover wh pode ultra passar as fronteiras da oração que o contém em estrutura-D. Compare-se qualquer dos exemplos de (24), (25) e (26) com as seguintes frases: (33)
a. [Que discos]l (é que) [tu disseste [qoe o Manel ofereceu /, à Maria]]? b. [Que discos]t (é que) [tu não imaginas [se o Manel ofereceu /, à Maria]]? c. Eu não conheço o rapaz [[com quem]] [tn disseste [que a Joana saiu r,]]].
Nestes exemplos (que representam estruturas-S simplificadas), a posição ocupada em estrutura-D pelos constituintes Q em itálico encontra-se assi nalada pelo símbolo t representativo do seu vestígio. Ora a posição que estes constituintes ocupam nas estruturas-S de (33) não é a posição Comp da oração (menor) que contém t, mas sim a posição Comp da oração imediatamente superior. Desde que determinadas condições sejam satisfei tas (ver o capítulo 14), não parece existir nenhum limite quanto à distân cia entre a posição Comp ocupada por um constituinte Q em estrutura-S e a posição original da qual é movido: (34)
[Que discos], (é que) [tu disseste [que o Luís acha [que a Isabel pensa [... [que o Manuel ofereceu í, à Maria]]]]]?
Ao movimento «local» dos constituintes Q em (24), (25) e (26) (ou seja, para o Comp da oração menor que contém os constituintes Q em estrutura-D) chamamos Movimento wh curto: e ao movimento «não local» dos constituintes Q em (33) e (34) (ou seja, para o Comp de uma oração que não é a oração menor que contém esses constituintes em estrutura-D) chamamos Movimento wh longo. Uma das propostas mais interessantes da gramática generativa (feita pela primeira vez em Chomsky (1973)) é a de que o movimento wh longo se pode reduzir (e, em certos casos, tem de reduzir-se) a uma sucessão reiterada de movimentos wh curtos (uma hipótese 125
que ficou conhecida sob o nome de «ciclicidadc sucessiva de Mover wh»), Segundo esta hipótese, a derivação de (33a), por exemplo, procede do se guinte modo. Mover wh aplica-se uma primeira vez no âmbito da oração subordinada, movendo o constituinte Q para a posição Comp mais próxima do constituinte Q, isto é, o Comp da oração subordinada: (35) ts. +WH] k tu disseste ^ ofereceu /, à Maria]]]?
[que discos], que] [s o Manel
Seguidamente, Mover wh aplica-se de novo (agora sobre (35)), movendo o constituinte Q da posição Comp subordinada para a posição Comp da oração principal (a esta instanciação de Mover wh chama-se movimento de Comp pana Comp): (36) k [o_, [que discos],] [s tu disseste [s,[Comp t\ que] [s o Manel ofereceu t, à Maria]]]]? A estmtura-S (36) contém dois vestígios, um na posição básica (de estrutura-D) do consritiiintp que discos, e outro no Comp intermédio. Cada um deles é o reflexo de uma das aplicações de Mover wh sobre o constituinte ' Q. A obrigatoriedade ou opcionalidade das paragens em Comps intermé dios na derivação de um movimento wh longo é determinada pelo princípio da Suhjacência. Voltamos pois a este tópico no capítulo 14, onde discuti mos este princípio. 3.3. Substituição e adjunção Do ponto de vista dos efeitos que têm sobre as estruturas sintácticas, as regras de movimento dividem-se em duas classes: movimentos por substi tuição e movimentos por adjunção. Tanto Mover NP como Mover wh deslocam constituintes para uma posição vazia pré-exístente na estrutura-D. Para Mover NP, essa posição é a de (NP, S] (de sujeito da frase); e para Mover wh, é a posição Comp. Qualquer delas pré-existe ao movimento, visto que são independentemente geradas pelas regras categoriais da base (S’ ------> Comp S e S ------> NP ififl VP), A este tipo de regra chama-se movimento por substituição. Os movimentos por substituição obedecem a uma condição, chamada preser vação de eslruíura, proposta pela primeira vez no quadro da gramática ge nerativa por Bmonds (1970,1976). Uma versão dessa condição é a seguinte (XP é uma variável sobre as categorias sintagmáticas):
126
(37) Condição de Preservação de Estrutura (í) Um constituinte de categoria XP movido substituí necessariamente um nó vazio pré-exístente gerado pela componente categorial; (íi) esse nó vazio é ígualmente de categoria XP. Mover NP obedece íotegralmente às doas alíneas desta condição, já que o NP movido substitui o nó vazio de categoria NP correspondente à posi ção de sujeito. Quanto a Mover wh, satisfaz a alínea (i) da condição, mas não é inteiramente claro se satisfaz ou não a alínea (íi). Chomsky (1986a, 5) sugere que a categoria Comp alvo de um movimento wh é ocupada na base por um nó vazio de categoria idêntica ao constituinte Q movido (PP se este for um PP; NP se este for um NP, etc.). Assim, o Comp da oração (24a) tieria em estrutura-D a forma ilus trada em (38) (cf. (27)). Nesta análise, Mover wh obedece às doas alíneas da condição de preservação de estrutura. A outra classe de movimentos admitidos na TRL é a das adjunções. Neste tipo de movimento, uma categoria A é adjunta a uma categoria B, criando-se uma configuração, chamada adjunção, com uma das formas ilustradas em (39), consoante a adjunção é à esquerda ou à direita da categoria que é alvo da adjunção (A e B representam categorias; x e y representam símbolos terminais). (38)
Ü
Comp
S
[+WHJ
NP
NP
ó Manel
VP
Infl V
NP
PP
ofereceu
que discos
à Maria
127
I®W I A(0tm\*io de A: à Esquerda de B
A. . . B
B “
H
A
x
v
b. Adjmçào de A à Direita de B A ,
. . B
B
Antes da aplicação da regra, A e B são categorias independentes na es trutura sintáctica. Como resultado da regra, é criada uma nova categoria B que domina a categoria movida A bem como a anterior categoria B que é alvo da adjunção. A estrutura de adjunção resultante mantém pois a infor mação de que x é um constituinte de tipo A, de que y continua a ser um constituinte de tipo B, e de que a sequência xy ou yx é agora igualmente um constituinte de tipo B (dado que a adjunção é a B). Repare-se que a adjunção não pressupõe que a categoria que é alvo da adjunção (no esquema, B) se encontre vazia em estrutura-D. Antes pelo contrário, uma adjunção é sempre a uma categoria que domina material lexical antes da operação de adjunção. Um exemplo de movimento por adjunção é a regra chamada de «in versão livre», que move o NP sujeito para uma posição no final da frase nas línguas românicas de sujeito nulo: (40) a. [O primeiro-ministro] assistiu ao espectáculo, b. Assistiu ao espectáculo [o primeiro-ministro]. Rizzi (1982, capítulo 4), que discute pormenorizadamente os efeitos da in versão livre, sugere que o NP sujeito é adjunto ao VP (à sua direita). Se gundo esta proposta, as eslruturas-D e S de (40b) são aquelas ilustradas em (41) ((41a) é também a estrutura-D e S de (40a)). Em Raposo (1988) sugere-se que a adjunção é a S, e não a VP. Segundo esta proposta, a eslrutura-S de (40b) é dada em (42). 128
(41) *
I
129
Em qualquer dos casos, a configuração resultante da aplicação da regra e&Ut dc acordo com o esquema (39b): a categoria que é alvo da adjunção (VP ou S) possui duas instanciaçbes, uma dominando exaustivamente o material lexical que a categoria dominava antes da aplicação da regra; e outra dominando esse mesmo material lexical mais a categoria adjunta a ela. Outro exemplo de movimento por adjunção 6 a regra de Topicalizaçflo, cujas propriedades em Português são estudadas por Duarte (1987). Segundo esta autora, a derivação de uma frase como (43a) envolve a adjunção do NP esses discos ao nó S (da oração subordinada, neste caso), como se mostra na estrafura-S (43c), derivada a partir da estruturt-D (43b): (43) a. Eu acho que esses discos, o Luís nunca ouviu.
130
c.
s
3.4. Movimentos-A e movimentos-A’ Na estrutura das frases faz-se a distinção entre duas classes de posi ções, chamadas respectivamente posições argumentais (posições A) por um lado, e posições não argumentais, A-barra, não-A ou A’ (leia-se «A-barra») por outro. As posições argumentais (A) são aquelas ocupadas canonicamente em estrutura-D pelos argumentos de uma frase, isto é, pelo NP sujeito e pelos complementos subcategorizados (incluindo a posição vazia de sujei to que é alvo de Mover NP nas construções passiva e de elevação). São pois aquelas em que se definem as relações gramaticais básicas da frase (sujeito, objecto directo e objecto de preposição; ver o capítulo 2.6). As posições não argumentais (A’), por outro lado, compreendem a posição Comp e a posição do elemento adjunto numa configuração de adjunção (a posi ção de [Ax na parte direita da seta em (39)). Consideremos a título de exem plo a estrutura-S da frase (24a), dada em (28), e aqui repetida: 131
Em (28), o constituinte Q que discos está numa posição não-A (Comp); o seu vestígio t e o NP a Maria, pelo contrário, estão numa posição A. Consideremos agora (41b), (42) ou (43c). Aí, os NP o prim eiro-m inistro e esses discos estão numa posição não-A (de adjunção). A dicotomia entre posições A e posições não-A permite introduzir uma distinção paralela nas regras de movimento entre Mover NP, por um lado, e Mover wh e as regras de adjunção, por outro. Mover NP move uma categoria para uma posição A, e é assim classificada como uma instanciação de Movimento A. Mover wh e os movimentos por adjunção movem categorias para uma posição não-A, e são assim classificados como instanciações de Movimento não-A ou A-barra. A distinção entre movimen tos por substituição e movimentos por adjunção recobre assim apenas parcialmente a distinção entre movimentos A e movimentos não-A, já que esta última categoria inclui os movimentos por adjunção mas também Mover wh, que é um movimento por substituição. A tipologia das regras de movimento é ilustrada no seguinte esque ma (l3):
Mov. A Mov. não-A
Substituição
Adjunção
Mover NP Mover wh
Inversão Livre, etc.
(,}) O vazio na intersecçãò dos movimentos A e dos movimentos por adjunção não é acidental. Tais movimentos não podem existir, já que uma posição A, por definição, é independentemente gerada pelas regras categoriais da base, e pré-existe ao movimento, ao passo que a posição de um NP movido por adjunção é criada pela própria regra. 132
3,5, Mover u Uma tias sugestões mais interessantes feitas por Chomsky (cf. Chomsky (1980a; 1981 j) é a de que as regras de movimento permitidas pela gramática universal (como Mover NP, Mover wh, Inversão livre e outras) se podem reduzir ao seguinte esquema único, extremamente simples (em que a é uma variável sobre as categorias gramaticais como NP, PP, VP, constituinte Q, etc.): (44) Mover a Mover a significa exactamente: mover qualquer constituinte pertencente a qualquer categoria gramatical, de qualquer posição sintáctica para qual quer outra posição sintáctica, opcionalmente e sem restrições específicas va riáveis de língua para língua ou de construção para construção na formu lação da regra. Neste modelo, as regras particulares Mover NP e Mover wh não são mais do que instanciações possíveis deste esquema. Mover a, no entanto, sobregera consideravelmente. Por exemplo, o movimento de um NP por substituição é sempre para a posição vazia de sujeito, e nunca para a posição vazia de objecto directo. Mover a, no entanto, permite a priori uma situação deste tipo. É pois fundamental restringir a aplicação da re gra aos casos de movimento que realmente ocorrem nas línguas humanas. Na linha do que já foi dito para Mover NP e Mover wh, estas restrições são o resultado da interacção entre Mover a e princípios universais, os quais reduzem a sua aplicação a um número extremamente reduzido de possibi lidades. Na etapa actual da investigação, Mover a é mais um objectivo teórico no âmbito do programa de investigação da TRL do que uma realidade as sente. O sucesso do programa neste ponto depende crucialmente de dois factores: por um lado, a descoberta dos princípios universais que restrin gem a regra e, por outro lado, a possibilidade teórica de reduzir a este esquema todos os casos concretos de movimento que ocorrem nas línguas particulares. De um ponto de vista empírico, este modelo implica duas coisas: pri meiro, que as línguas humanas não possuem regras transformacionais individuais com restrições particulares a cada uma delas (como, por exem plo, em anteriores modelos, a regra passiva, ou a regra de formação de in terrogativas); em segundo lugar, que a variação linguística na componente transformacional se reduz a dois aspectos precisos: línguas diferentes podem diferir (i) no conjunto de valores que atribuem a a ; ou (ii) na concretização paramétrica dos princípios independentes que restringem a regra. 133
p0 fHxiii» ilc vista da aprendizagem, um modelo deste tipo facilita mmfctrravcInKntc a aquisição de uma língua pela criança. Dado que tanto M ovcr « como os princípios universais que restringem n regra fa/cm |w tc do mecanismo inato de aquisiçio, o que a criança tem do aprender resume se à parametrizaçio do valor de a na sua língua e à eventual paramctn/aç&o de alguma ou algumas das condições que restringem a regra. IS? Em (45) identifícamos algumas das questões que se colocam à TRL no programa de reduzir a componente transformacional à regra Mover ol Que classe de constituintes são movidos? De que posições podem ser movidos? Que acontece na posição de onde são movidos? (iv) Para que posições podem ser movidos? Que tipo de estrutura resulta desse movimento? (V) (vi) O «espaço» estrutural do movimento (isto é, a distância entre o ponto de partida e o ponto de chegada do movimento) é limitado ou ilimitado? (vii) O movimento é obrigatório ou opcional?
(45) (i)
00
m
A resposta a (45i), como vimos, é extremamente geral: qualquer cate goria a pode em princípio ser movida; a é no entanto sujeito a variação paramétrica: as línguas individuais podem-lhe atribuir valores particulares. Numa dada língua, por exemplo, a pode ser o conjunto {NP, constituinte Q), noutra língua pode ser apenas o conjunto {NP}, noutra língua o con junto vazio (uma tal língua pura e simplesmente não possui regras de mo vimento), e assim pcrr diante. A resposta a (45iii) é dada pela Teoria dos Vestígios: o movimento de uma categoria deixa na posição «de partida» um nó vazio categorialmenle idêntico e eo-indexado com ela (como vere mos no capítulo 9, a Teoria dos Vestígios é por sua vez redutível à Teo ria Temática). Algumas das propriedades de Mover a parecem ser irredutíveis a outros aspectos da gramática, e são objecto de princípios universais que têm como função restringir a regra em si mesma— é o caso, por exemplo, do Princípio da Subjacência, que faz parte do módulo da TRL conhecido como Teoria das Fronteiras, e que se ocupa da questão (45vi). A maioria das proprie dades de Mover a, no entanto, íem um alcance mais gerai, e são reduííveis a condições impostas por outros sistemas da gramática e aplicáveis a fenômenos gramaticais que não têm directamente a ver com a regra em si 134
m esm a U g a ç lo ,
é o
cm o,
co m o
veremo», de certo* princípios
das
teoria» da
do C imo e da» PunçOet Temática». Deste modo, uma caracterizaçfto completa de Mover a *6 pode ser dada I medida que introduzirm os
estas teoria» f 4).
(M) No decorrer deste livro, continuamos a parücularizar as regras (em Mover NP, Mover w h, etc.). 135
Capítulo 5
A forma lógica
1. O nível de representação forma lógica Na sequência de propostas feitas por Chomsky (1977b, 165 e sgs.) e May (1977; 1985), considera-se que o modelo gramatical contém um nível de representação abstracto independente das estrutura-D e -S, e cuja fun ção consiste em representar os aspectos do significado de uma oração que são determinados pelas suas propriedades estruturais. A este nível de representação chama-se Forma Lógica (LF, do Inglês «Logical Form»), e ao conjunto de regras que deriva a Forma Lógica chama-se componente Forma Lógica (*). A investigação das propriedades de LF passa pelas seguintes questões: (i) quais são as propriedades semânticas a representar em LF? (ii) Que tipo de representações e de categorias é que LF contém? (iii) Que tipo de regras se aplicam na derivação de LF? (iv) Qual é a articulação entre LF e os níveis estrutura-D e estrutura-S? As secções seguintes procuram dar uma resposta a estas questões.
2. L F e M over a : a Regra QR Uma das motivações iniciais de May (1977) para a postulação do nível de representação LF surgiu do problema de representar adequadamente as propriedades semânticas e sinlácticas dos operadores lógicos e dos consti tuintes com força quantificacional. A proposta de May é de que a gramática deve tratar estes elementos de um modo semelhante aos sistemas de lógica
(') A utilização da mesma expressão paia designai a componente e o nível de re presentação que é a saída da componente pode causar confusão. Esperamos que em cada momento o contexto da discussão seja suficiente paia desambiguai os dois sentidos.
137
d® predicados de primeiro grau. Consideremos a título dc exemplo a sefutntc frase: ( 1) Esse professor passa qualquer estudante. O item lexical qualquer tem força quantifícacional (universal): um dos aspectos do seu significado pode ser representado através do quantificador universal V de um sistema de lógica de predicados (este aspecto não es gota o seu significado, no entanto: ver Mateus et al. (1989, 67-69)). Aos itens lexicais com força quantifícacional chamamos Quantificadores (Q), e aos constituintes de que fazem parte (como qualquer estudante em (1)), chamamos Grupo de Quantificador (QP, do Inglês «Quantifier Phrase») (2). Em Português, a classe dos Quantificadores inclui itens como muito(s), pouco(s), todo(s). um. vários, bastantes, entre outros. Num sistema de lógica de predicados, a representação do significado lógico de (1) contém um quantificador universal, ligando uma variável na posição de objecto directo: (2) Vx, x estudante [esse professor passa x]. Em (2), dizemos que o quantificador universal «Vx, x estudante» (a ler «para todo o x, tal que x é estudante») tem escopo sobre toda a estrutura entre parênteses, incluindo a variável por ele ligada (3). Segundo May (1977; 1985), o próprio sistema gramatical deve atribuir a (1) uma representação semelhante a (2), com o Quantificador qualquer (na realidade, o QP qualquer estudante ocupando uma posição periférica à esquerda da oração, e ligando uma variável na posição de objecto direc to. May afirma que, para derivar esse nível de representação, a gramática não precisa de nenhum mecanismo novo. Dado que se trata na realidade de um movimento, a regra Mover a, com a = QP, pode ser utilizada para efectuar essa derivação. May propõe concretamente que a deslocação de um QP consiste num movimento de adjunção à esquerda de S, e chama a esta instanciação de Mover a Elevação do Quantificador (que simbolizamos por QR, do Inglês «Quantifier Raising»). A aplicação de QR sobre (1) deriva a estrutura (3), que é a Forma Lógica da oração (1) (omitimos os nós não relevantes Comp e Infl): 0 Um QP, no entanto, é categorialmente um NP, podendo ser deslocado por Mo ver NP, como veremos. (3) Seguindo a prática comum da TRL, adoptamos um sistema de quantificação restrita, em que o universo da quantificação é directamenle representado como uma restrição no
quantificador. 138
Como em todas as aplicações de Mover a o movimento do QP por QR deixa um vestígio na posição de origem do constituinte movido. A re lação entre o QP e o seu vestígio em (3) é paralela à relação existente em (2) entre o quantificador universal e a variável x. Explorando este parale lismo, May nota que a relação entre o QP e o vestígio pode ser directamente interpretada como uma relação de quantificador a variável. A regra Mover a revela-se pois como um mecanismo adequado para derivar as pro priedades lógicas da quantificação. QR aplica-se sobre a estrutura-S, e não sobre a estrutura-D. Este pon to, que não é imediatamente visível em (1) (dado que a estrutura-S deste exemplo é idêntica à sua estrutura-D), pode ser ilustrado em (4): (4) qualquer aluno é chumbado por esse professor. A estrutura-D de (4) é (5): (5) [f [np e] Infl [w é chumbado [NP/QP qualquer aluno] por esse professor]] i
Sobre (5) aplica-se em primeiro lugar Mover NP, que desloca o NP/QP qualquer aluno para a posição vazia de sujeito (onde determina a con cordância verbal): (6) [s [NP/QP qualquer aluno], Infl professor]] 139
é chumbado í, por esse
A representação (6) é a estruturs-S de (4). Sobre esta estrutura upllca-se •fora QR. derivando (7), a LF de (4) (4):
(7) ls
qualquer aluno], [s t \ Infl [vp 6 chumbado /, por esse professor]]]
Nesta estrutura existem dois vestígios: um em posição de objecto directo, resultado de Mover NP; e outro na posição de sujeito, resultado de QR. Apenas este 6 interpretado como uma variável ligada pelo quantificador. De facto, num sistema de lógica de predicados, a representação lógica de (4) é «Vx, x estudante, x é chumbado por esse professor», com a variável na posição de sujeito e não na posição de objecto. É pois necessário res tringir a teoria dos vestígios de tal modo que apenas o vestígio mais à es querda em (7) seja interpretado como variável. Voltamos a esta questão mais à frente. A aplicação de Mover a em (3) ou (7) é invisível (ou inaudível), isto é, não tem repercussões sobre a representação fonética das frases, nomea damente sobre a ordem dos constituintes. O que conta para a ordem de constituintes na pronúncia de (1) e (4) é a posição do NP/QP qualquer estudante em estrutura-S, e não em LF. LF representa apenas as proprie dades de escopo abstractas da oração, as quais não determinam a posição concreta dos constituintes em estmtura-S. O inverso desta asserção, no entanto, não é necessariamente verdadeiro, como mostram as estruturas de quantificação múltipla (ver a secção 3) ou as orações com um operador lógico (como a negação) e um quantificador. Neste caso, o operador ou quantificador mais à esquerda é mais facilmen te interpretável como tendo escopo superior ao operador ou quantificador mais à direita. Considerem-se, por exemplo, as seguintes expressões (adap tadas de Jackendoff (1972)): (8) a. Todas as setas não acertaram no alvo. b. Não acertaram no alvo todas as setas. A interpretação mais natural de (8a) é aquela em que nenhuma seta acer tou no alvo. Na representação lógica desta interpretação (dada em (9a)), o quantificador universal tem escopo sobre a negação («para todas as setas, não é verdade que acertaram no alvo»). A interpretação mais natural de(*)
(*) Note-se que a ordenação linear é a mesma em (6) e (7), embora a estrutura seja diferente: em (6), o QP qualquer aluno está na posição de sujeito, ao passo que em (7)
esií
numa posição de adjunção a S (e um vestígio ocupa agora a posição de sujeito).
140
(8b), por outro lado, é aquela em que algumas setas acertaram no alvo, mas algumas não acertaram. Na representação lógica desta interpretação (dada em (9b)), a negação tem escopo sobre o quantificador universal («não é verdade que todas as setas tenham acertado no alvo»): (9) a. Vx, x seta, ~ (x acertou no alvo], b. ~Vx, x seta, [x acertou no alvo). A ordem do QP e da negação em estrutura-S determina pois o seu escopo relativo «mais natural» («mais natural», porque é também possível obter a interpretação (9b) para (8a) e a interpretação (9a) para (8b)). Estes casos desempenharam um importante papel histórico na gramática generativa, por terem contribuído para a conclusão teórica de que o nível de representa ção que é semanticamente interpretado é a estrutura-S, e não a êstmturá-D (repare-se que a estruíura-D de (8a) e (8b) é presumivelmente a mesma) (5). Como vimos, a derivação de LF a partir da estrutura-S utiliza crucialmente a regra que deriva as estraturas-S a partir das estruturas-D, ou seja, Mover a. Este facto, por sua vez, implica que o tipo de estruturas e de categorias que compõem a Forma Lógica são semelhantes às categorias e estruturas que funcionam na sintaxe. Isto é, a Forma Lógica contém NPs, QPs, VPs, Infl, etc., tal como os níveis de representação estratura-D e estrutura-S; e estas categorias mantêm entre si o mesmo tipo de estrutura hierárquica que caracteriza as estruturas sintácticas propriamente ditas. Deste ponto de vista, a Forma Lógica é mais um nível de representação «sintáctico», tal como a estrutura-D e a estrutura-S. Na TRL, considera-se assim que a estrutura-D, a estrutura-S e LF (assim como a regra Mover a que deriva estes níveis) formam a sintaxe em sentido lato, por oposição à fonologia. Repare-se que o facto de a regra transformacionai Mover a ser a regra principal da componente Forma Lógica implica que deixa de ser correcto chamar à componente situada entre a estratura-D e a estrutura-S «compo nente transformacionai». Seguindo a prática da TRL, passamos a chamar a esta componente «sintaxe propriamente dita» ou «sintaxe estrita» (que se distingue pois da sintaxe em sentido lato por excluir a componente Forma Lógica).
(5) Esta conclusão não foi no entanto atingida de modo pacífico (ver Newmeyer (1980, capítulo 5)). Para as posições originais do debate, ver por exemplo Jackendoff (1972) e Lakoff (1971).
141
.V Ambiguidades de escopo A rcgtr* QR permite uma representação explicita das ambiguidades de rsrxyv nos casos de quantificação múltipla. Considere-se a seguinte frase, analisada na sua estnitura-S (simplificada): 0 0 ) (s U p Todos os alunos] (w passaram (NjyQP um exame]]]. Esta oração é ambígua entre uma interpretação em que todos os alu nos passaram um exame qualquer, não necessariamente o mesmo (possi velmente a interpretação mais natural, ver a discussão na secção anterior), c uma interpretação em que existe um dado exame particular que todos os alunos passaram. Esta ambiguidade, que tem a ver directamente com uma diferença no escopo relativo dos dois QPs, pode ser representada através da atribuição de duas LFs distintas à estnitura-S (10). Uma dessas LFs é derivada aplicando QR em primeiro lugar sobre o QP um exame, derivan do a seguinte estrutura intermédia: (H ) [s 1 ,^ um exame], [s
todos os alunos]
passaram r,]]]
Sobre (11) aplica-se de novo QR, desta vez sobre o QP todos os alunos, derivando (12). Note-se que este QP é agora adjunto ao nó S criado pela anterior adjunção, criando um terceiro nó S:
passaram 142
t
A estrutura (12) é urna da* LF# de (10), Em (12). o QP todo* os aluno* encontra «c numa pottçlo estruturalmeate maj* elevada que o QP um exame, tendo portanto escopo «obre e«te QP (*). Ecta estrutura corresponde pois à leitura cm que todo* os alunos passaram um ou outro exame, não neces sariamente o mesmo, A derivação da outra LF de 00) procede do seguinte modo. QR apli ca-se agora em primeiro lugar sobre o QP todos os alunos, derivando a seguinte representação intermédia: (13)
[s [NP/QP todos os alunos),
r, (w passaram [w
um exame]]]]
QR aplica-se agora sobre (13), movendo o QP tun exame para uma posi ção de adjunção ao S criado pela adjunção anterior (14)
[s [np/qp um exame]2 [s
todos os alunos], [4 /,
passaram
[ NP/QP
Na Forma Lógica (14), o QP um exame tem escopo sobre 0 QP todos os alunos. Esta estrutura corresponde pois à leitura em que existe um exame específico que todos os alunos passaram. As duas Formas Lógicas (12) e (14) são semelhantes às representações que a frase (10) teria num sistema de lógica de predicados: (15) a. Vx, x aluno, 3y, y exame, [x passou yj. b. 3y, y exame, V , x aluno, [x passou y]. Sem QR e a possibilidade de ordenar as suas aplicações de modo distin to, não seria claro como representar a ambiguidade de (10) O-
(6) No capítulo 8 damos uma definição explícita da relação «estruturalmente mais ele vado» através da noção de c-comando. Nas configurações gramaticais, o escopo é expres so pela relação de c-comando. O Por motivos que não cabem no âmbito deste livro. May (1985) propõe que a regra QR pode fazer a adjunção de um QP à categoria VP. e que na Forma Lógica da leitura de (10) em que todos os alunos tem escopo sobre um exame, este último QP é adjun to ao nó VP, e não ao nó S: (i) [s Inpjqp todos os alunos], |s r, (VT [NWQp um exame], [VT passaram
í,]]]]
Em (i), a relação de escopo entre todos as alunos e um exame mantém-se idêntica a (12), visto que todos os alunos continua numa posição estrutural mais elevada do que um exame. A Forma Lógica da outra leitura de (10) proposta em May (1985) é idêntica à que demos acima. 143
4. O cruzamento fraco A hipótese de que o escopo das expressões quantifícacionais nas línguas humanas é dado através de uma regra de movimento (deixando um vestígio* -variável) não é puramente conceptual, ou seja, não sc trata apenas de imitar o tratamento conceptual da lógica de predicados. Pelo contrário, existem argumentos empíricos para derivar a LF das expressões quantificadas atra vés da aplicação «invisível» da regra Mover a. Um dos argumentos mais interessantes vem do fenômeno conhecido como «cruzamento fraco» (em Inglês «weak cross-over»), descrito pela primeira vez em Postal (1971) (ver também Wasow (1972; 1979) e Chomsky (1977b, 199 e sgs.)). Conside rem-se as seguintes frases: (16) a. [A mulher que ele amava] abandonou o Luís. b. [O pai dele] ofereceu um carro ao João. c. [O facto de eia não poder ir à festa] entristeceu a rapariga. Nestas frases, os pronomes pessoais dentro das expressões entre parênteses podem referir-se, respectivamente, aos NPs o Luís, o João e a rapariga. Assim, por exemplo, (16b) pode significar algo como «o pai de um dado indivíduo x», chamado João ofereceu um carro a esse mesmo indivíduo x», e é possível atribuir interpretações semelhantes aos outros exemplos (8). Existe outra interpretação para (16) (talvez a mais natural), que é aquela em que os pronomes se referem a entidades identificadas no âmbito do dis curso, mas que não são nem o Luís, nem o João, nem a rapariga referida pelo NP objecto directo, respectivamente. Nesta leitura, (16b), por exem plo, significa algo como «c pai de um dado indivíduo x ofereceu um car ro a um indivíduo y diferente chamado João». Chamemos a estas duas leituras, respectivamente, «leitura co-referente» e «leitura não co-referente» (ver o capítulo 8 para uma discussão mais aprofundada da noção de co-referência). Suponhamos agora que temos em estrutura-D constituintes Q (interro-
(*) A aceitabilidade das frases de (16) com esta interpretação varia de falante para falante. Abstraímos aqui dessa variação. De qualquer modo, reconhecemos que o modo mais natural de exprimir essa significação é através de frases em que o NP precede o pronome, como, por exemplo, o facto de a rapariga não poder ir à festa entristeceu-a. Este facto é irrelevante para o argumento que apresentamos no texto, que depende apenas da aceitabilidade de (16) com a interpretação proposta. Note-se que as frases que servem de base ao argumento que apresentamos contém necessariamente um pronome lexical. As frases com um pronome nulo (como o facto de não poder ir à festa entristeceu a rapariga) são irrelevantes paia o argumento a desenvolver. 144
gutivos) na posição ocupada pelos NP* o Luís, o João t a rapariga (por exemplo quem ou que rapariga), e que a oração principal é interrogativa (o seu Comp é especificado em [+WH]). Esse* constituintes Q são movi dos através de Mover wh para a posição Comp, deixando um vestígio na sua posição de origem, derivando-se as seguintes expressões (com a estmtura-S simplificada aí indicada): (17) a. [s. quem, (é que) [a mulher que ele amava] abandonou r,]] b. [s. a quem, (é que) (o pai dele] ofereceu um carro (,]] c. [s, que rapariga, (é que) [o fado de ela não poder ir à festa] entristeceu ?,]] Estas expressões possuem apenas a leitura não co-referente, perdendo-se a leitura co-referente que é possível nos exemplos paralelos de (16). Assim, por exemplo, em (17b), de não pode referir-se à pessoa que serve de resposta à pergunta. Por outras palavras, (17b) não significa algo como «quem é o indivíduo x tal que o pai desse indivíduo x lhe ofereceu um carro». Do mesmo modo, não é possível atribuir leituras co-referentes a (17a,c). Chomsky (1977b) propõe ama condição para dar conta desta assi metria entre (16) e (17), baseada no facto de haver um constituinte (Q) movido em (17), ao passo que os NPs correspondentes permanecem na sua posição básica em (16) (9). Segundo essa condição, em (17) Mover wh cria uma estrutura com o constituinte Q à esquerda do pronome, e esta confi guração implica a perda da leitura co-referente (os detalhes, o funciona mento e a formulação exacta desta condição encontram-se para além do âm bito deste livro). Consideremos agora as expressões de (18), em que os NPs o Luís, o João e a rapariga são substituídos pelas expressões quantificacionais al guém e alguma rapariga: (18) a. [A mulher que ele amava] abandonou alguém. b. [O pai dele] ofereceu um carro a alguém. c. [O facto de ela não poder ir à festa] entristeceu alguma rapariga. Relativamente às leituras possíveis, o paradigma (18) alinha com o paradigma (17), e não com o paradigma (16). Assim, a leitura co-referente
(9) A utilização do termo «cruzamento» na caracterização deste fenômeno (propos ta por Postal (1971)) vem precisamente do facto de a leitura co-referente se perder quan do o constituinte Q cruza o pronome (no seu deslocamento para Comp).
145
ê também aqui impossível. A expressão (18b), por exemplo, nflo signtfí» ca algo como «o pai de alguém ofereceu-lhe um carro (a esse mesmo
alguém)»' I vta assimetria quanto à possibilidade de uma leitura co-rcfcrcntc en tre (17) e (18). por um lado, e (16) por outro, recebe um tratamento uni forme através da condição proposta em Chomsky (1977b). se aceitarmos • hipótese de May (1977) de que as expressões quantifícacionais sfio movidas em LF pela regra QR. Nessa análise, a Forma Lógica das expressões de (18) é semelhante à estrufura-S (e também à Forma Lógica, como vere mos) das expressões de (17). Nomeadamente, os QPs são movidos para a periferia da oração, deixando um vestígio na sua posição de origem: (19) a. [s alguém, [g [a mulher que ele amava] abandonou í,]] b. [s alguém, [s [o pai dele] ofereceu um carro a /,]] c. [g (alguma rapariga], [s [o facto de ela não poder ir à festa] entristeceu r,]] As configurações de (19) são semelhantes às configurações de (17). Em (19) , tal como em (17), os constituintes movidos estão numa posição à esquerda do pronome. A condição proposta por Chomsky aplica-se pois sobre (19) do mesmo que se aplica sobre (17), proibindo a leitura co-referente. 0 alcance deste argumento, portanto, é de que sem movimento dos QPs na Forma Lógica através de QR, não é possível unificar os dois paradig mas (17) e (18), por oposição ao paradigma (16).
5. A interpretação das orações interrogativas parciais Nas orações interrogativas parciais, como já sabemos, um constituinte Q é movido para uma posição Comp especificada em [+WH]. Considere mos a título de exemplo a estrutura-S (simplificada) (21), correspondente à oração (20): (20) Que livro o Luís emprestou ao amigo? (21) [s. [que livro], [s o Luís [„„ emprestou r, ao amigo]]] No âmbito de uma discussão detalhada da semântica das orações in terrogativas parciais, Chomsky (1973) propôs que estas recebam uma in terpretação semelhante às orações com quantificadores. Concretamente, Chomsky mostra que os constituintes Q têm força quantificacional, e, tal como os quantificadores, ligam uma variável. Num sistema de lógica 146
de predicado», • reprcxemaçâo lógica de (20) podería ter dada do seguinte modo:
(22) Para qual x, x livro (o Luís emprestou x ao amígoj. Em (22), a expressão «para qual x» é ura quantifícador interrogativo, paralelo aos quantíficadores universal (Vx) e existencial (3x). (Poderiamos repre sentá-lo, por exemplo, através do símbolo «?x»,) lima representação seme lhante a (22), no entanto, é já produzida independentemente pela gramática. Trata-se evidentemente da estnitura-S (21), derivada através de Mover wh. Nesta representação, o constituinte Q em Comp está numa posição parale la ao quantificador «para qual x» em (22), É pois possível interpretar directamente o constituinte Q que ihrco em Comp como um quantificador, e o vestígio deixado pelo seu movimento como a variável ligada por ele.
6. D efinição de variável Tendo em conta que as posições ocupadas por elementos com força quantificacional (Comp no caso dos constituintes Q movidos por Mover w/t, e a posição de adjunção a S no caso dos QPs movidos por QR) são ambas posições não-A, toma-se possível definir a noção de variável do seguinte modo: (,0) (23)
Variável Uma variável é uma categoria vazia localmente ligada por uma categoria em posição não-A.
A definição de variável é independente do nível de representação, isto é, não se aplica exclusivamente à componente (e ao nível de representa ção) Forma Lógica. Assim, tanto os vestígios deixados por Mover wh em estrutura-S como aqueles deixados por QR em LF se qualificam como (*°) Por motivos que se encontram para além do âmbito deste livro, a noção de variável é definida em termos da noção de categoria vazia, e não da noção de vestígio. Recotdemo-nos que os vestígios são apenas um dos tipos de categorias vazias reconhecidas na TRL (ver, para mais pormenores, os capítulos 11 e 16). O alcance da definição (23) é de que uma variável não é necessariamente um vestígio. Este é o caso, por exemplo, se o constituinte Q for directamente gerado na posição Comp que ocupa em estrutura-S, não sendo pois movido para aí pela regra Mover wh (ver Chomsky (1982) para uma discus são destes casos). Em estruturas deste tipo, a categoria vazia na posição que corresponde à variável não é um vestígio, dado que estes, por definição, têm sempre a sua origem numa regra de movimento.
147
vanAvns. (Podemos utilizar a expressão «variável sintácticu» para aquelas variáveis presentes em estnitura-S e a expressão «variável lógica» pura aquelas presentes em LF. Assim, as variáveis deixadas por Mover wh são sintãeticas (em estmtura-S) e lógicas (em LF), ao passo que us variáveis deixadas por QR são unicamente lógicas, cm LF.) A noção «ligado» nesta definição é tecnicamente definida no capítulo 8. Para já, notemos que envolve a co-indexaçào entre o elemento que liga (ou seja, o quantiflcador) e o elemento ligado (ou seja, o vestígio-variável). Este requisito é satisfeito por definição pela regra Mover a, como vimos no capítulo anterior. A qualificação «localmente» (da qual também dare mos uma definição técnica no capítulo 8) destina-se a evitar (por exem plo) que na representação (7) (aqui repetida), o vestígio em posição de objecto directo seja interpretado como uma variável: (7)
[s [j^p qualquer aluno], [s í, Infl [w é chumbado í, por esse professor]]]
Este vestígio, embora sendo ligado pelo QP (visto que está co-indexado com ele) não é localmente ligado, visto que entre ele e o QP encontra-se um outro vestígio com o mesmo índice na posição de sujeito. Como vimos acima, é este último vestígio que é interpretado como uma variável, em satisfação da definição (23). As estruturas com movimento wh longo, no entanto, levantam um problema para uma interpretação excessivamente restrita do requisito de lo calidade na ligação da variável pelo quantiflcador. Consideremos a estru tura (4.36), aqui repetida em (24), da oração que discos (é que) tu dis seste que o Manel ofereceu I Maria: (24) [s. j j | [que discos],] [s tu disseste [s, [Comp 1 que] [s o Manel ofereceu | à Maria]]]]? Nesta estrutura, de acordo com a definição (23), a variável é o vestígio na posição Comp intermédia, visto que é este o vestígio localmente liga do pelo constituinte Q que discos no Comp da oração principal. De um ponto de vista lógico, no entanto, não faz sentido tomar o vestígio inter médio como sendo a variável ligada pelo constituinte Q. De facto, a interpretação lógica desta oração é algo como «para quais x, x discos, tu disseste que o Manel ofereceu x à Maria». Nesta interpretação, a variável ocupa claramente a posição do vestígio mais à direita na posição de ob jecto directo. A solução para este problema passa pelo reconhecimento de que uma variável é essencialmente um argumento desempenhando uma função lógico148
-gramatical. Como tal, apenas pode ocupar uma posição A, e não uma posição A*. A definição (23) pode pois ser modificada do seguinte modo: (25) Variável Uma variável é uma categoria vazia numa posição A localmente ligada por uma categoria em posição não-A (A’). Em (24), o único vestígio em posição A localmente ligado por uma cate goria em posição não-A é o vestígio na posição de objecto directo. Existem certos casos de Movimento wh em que a variável sintáctica (deixada directamente por Mover wh) não conesponde a variável lógica. Um destes casos tem a ver com os constituintes Q de categoria grama tical PP. Consideremos a título de exemplo a seguinte oração interro gativa: (26) Com quem (é que) a Maria saiu? A estrutura-S (simplificada) de (26) é a seguinte: (27) [s, [com quem], [s a Maria [w saiu fjj] O vestígio t em (27) é uma variável sintáctica (está numa posição A, e é localmente ligado por um constituinte Q numa posição não-A). Este vestígio, no entanto, não corresponde à variável lógica. A representação lógica de (26), de facto, é algo como «para qual x, x pessoa, a Maria saiu com x». Nesta paráfrase, a variável lógica corresponde apenas ao NP dentro do PP. Há razões para supor que LF possui uma regra, chamada Reconstru ção, que deriva a representação (28) (equivalente à paráfrase lógica) a partir da estrutura-S (27): (28) [s, [quem], [s a Maria [w saiu com x,]]] A regra de Reconstrução efectua duas modificações. Em primeiro lugar (como o nome indica) reconstrói na posição A ocupada pelo vestígio sintáctico todo o material movido para Comp excepto o constituinte Q/NP directamente com força quantificacional. No caso de (27), o material re construído é a preposição com. Em segundo lugar, insere uma variável «puramente lógica» (que simbolizamos como x) na posição A correspon dente ao constituinte Q deixado em Comp (isto é, não reconstruído). Para uma discussão da motivação desta regra, bem como de outros casos em que se aplica, ver, entre outros, van Riemsdijk e Williams (1981; 1986) e Safir (1986). 149
7. M over wh em LF Existem línguas, como por exemplo o Chinês e o Japonês, em que o constituinte Q de uma oração interrogativa parcial ocorre necessariamente in situ, isto é, na posição A que corresponde à sua função gramatical básica, e não na posição Comp na periferia da oração. À primeira vista, estas línguas não possuem pois a regra Mover wh (isto é, em Mover a, a ^ wh). O contraste entre os seguintes exemplos do Chinês e do Português mostra esta diferença (exemplos Chineses de Huang (1982b)): (29) a. Ni xihuan shei? tu gostas quem b. Wo xiang-zhidao [ Lisi mai-le sheme]. eu pergunto-me Lisi comprou o quê (30) a. De quem (é que) [tu gostas]? b. Eu pergunto-me [o que [a Lisi comprou]]. Apesar destas diferenças, Huang mostra que as propriedades de es copo dos constituintes Q são as mesmas em línguas como o Portu guês, em que há movimento, e em línguas como o Chinês, onde não há movimento. Assim, por exemplo, o escopo do constituinte Q shei in situ em (31a) é diferente do escopo que este constituinte tem em (31b), ainda que a sua posição em estrutura-S seja exactamente a mesma: (31)
a. Zhangsan wen wo [shei mai-le shu]. Zhangsan perguntou me quem comprou livros «o Zhangsan perguntou-me quem comprou livros» b. Zhangsan xiangxin [ shei mai-le shu]. Zhangsan acredita quem comprou livros «Quem é que o Zhangsan acredita que comprou livros?»
O verbo principal de (31a) subcategoriza uma oração subordinada interro gativa (um S’ especificado em [+WH]), ao passo que o verbo principal de (31b) subcategoriza uma oração subordinada declarativa (um S’ especifi cado em [-WH]). Nas duas orações o constituinte Q ocupa a posição de sujeito da oração subordinada. Do ponto de vista da sua representação lógica, no entanto, o constituinte Q em (31b) tem escopo sobre toda a estrutura (como se vê pela paráfrase dada em Português), ou seja, a frase é inter pretada como uma interrogativa directa. Em (31a), pelo contrário, o cons tituinte Q tem escopo apenas sobre a oração subordinada (cf. igualmente 150
a paráfrase em Português), ou seja, a frase é interpretada como uma inter rogativa indirecta. Huang sugere que esta diferença na estrutura lógica das duas frases deve ser representada pela gramática no nível da Forma Lógica, e que o modo mais simples de atingir este resultado consiste em permitir que a regra Mover w h se aplique em Chinês na componente Forma Lógica, de modo invisível. Segundo esta proposta, o Chinês difere do Português de um modo menos radical do que podería parecer à primeira vista. Em particular, a diferença entre estas duas línguas não reside na presença vs. ausência de Mover wh, mas sim unicamente na localização particular da regra em componentes distintas do modelo gramatical. Assim, enquanto que em Português Mover w h se aplica entre a estrutura-D e a estrutura-S, na componente sintáctica propriamente dita, em Chinês a regra aplica-se entre a estrutura-S e LF, na componente Forma Lógica. O nível de representação LF (simplificado) dos exemplos (29a,b) e (31a,b) é pois (32), paralelo à es trutura-S (e LF) (33) dos exemplos correspondentes do Português: (32) LF a. [shei, [ni xihuan í,]] b. wo xiang-zhidao [sheme, [Lisi mai-le í,]] c. Zhangsan wen wo [shei, [í, mai-le shuj] d. [shei, [Zhangsan xiangxin [r, mai-le shu]]] (33) Estrutura-S, LF a. [de quem, [tu gostas í,]] b. eu pergunto-me [o que, [a Lisi comprou í,]]. c. Zhangsan perguntou-me [quem, [í, comprou livros]] d. [quem, [Zhangsan acredita que [í, comprou livros]]] Esta análise sugere que a regra Mover a se encontra associada a um segundo parâmetro (para além daquele que atribui um valor a a), que tem a ver com a determinação do nível em que a regra se aplica, para cada valor concreto de a. Assim, em Chinês, a = (wh, LF), ao passo que em Português a = ( w h , estrutura-S) (mas ver a discussão a seguir). Em Português, Mover wh também se aplica opcionalmente em LF, sob certas condições. Considerem-se as seguintes expressões: (34) a. Tu gostas de quem? b. Tu achas que ela gosta de quem? Pragmaticamente, estas orações podem ser utilizadas com duas finalidades muito diferentes. Uma possibilidade é que estas frases não sejam usadas 151
como perguntas reais. Por exemplo, o falante pode conhecer o referente do pronome interrogativo (tecnicamente o referente da variável ligada pelo quantificador interrogativo), e não faz mais que assinalar o seu espanto quanto à pessoa identificada. Pode também dar-se o caso que tenha havido uma comunicação falhada da parte do interlocutor, e que a informação sobre o valor de «quem» não tenha sido ouvida pelo falante, que pede então que a informação seja repetida. Nestes casos, o pronome interrogativo recebe um acento mais forte do que os restantes elementos da frase, e a entoação desta é ascendente. Quando utilizadas deste modo não interrogativo, as orações com constituintes Q chamam-se interrogativas-eco. As frases de (34), no entanto, podem também ter um uso verdadeiramente interrogativo (em que se pede informação sobre o valor de «quem»). Neste uso, são sinônimas de (35), e os seus constituintes Q têm escopo sobre toda a frase (M): (35) a. De quem é que [tu gostas]? b. De quem é que [tu achas que ela gosta]? Segundo o espírito da proposta de Huang, Mover wh aplica-se sobre (34) na Forma Lógica (tal como em Chinês), derivando as seguintes represen tações (muito simplificadas): (36) a. H [de quem], [s tu gostas í,]] b. [s, [de quem], [| tu achas que ela gosta t,]] Estas representações constituem a LF de (34) (na interpretação interrogati va), e a estrulura-S de (35). Ou seja, Mover wh aplica-se na Forma Lógica na derivação de (34), e na sintaxe propriamente dita na derivação de (35) | g | Uma outra instância em que Mover wh se aplica em LF em Português
(M) Neste uso, a entoação de (34) é ligeiramente descendente no final das expres sões, e não recai nenhum acento de intensidade sobre o constituinte Q. Para certos fa lantes, apenas os constituintes Q bi situ de orações simples ou de orações principais po dem receber esta interpretação. Para estes falantes, portanto, (34b) não é sinônimo de (35b), e apenas recebe uma interpretação eco. (,2) Contrariainente ao Chinês, no entanto, em Português Mover wh aplica-se obri gatoriamente na sintaxe propriamente dita quando o movimento do constituinte Q é para um Comp [+WH] iubcategorizado. Compare-se assim a frase (gramatical) do Chinês (29b) (que repetimos aqui em (ia)) com a expressão paralela do Português (ib) (nâo-gramatical), e com a sua contraparte gratnatical (ic)): 152
(c cm Inglês também) é na derivação das orações interrogativas múltiplas como (37) e (38): (37) Quem jantou em que restaurante? (38) Ele perguntou-me quem tinha jantado em que restaurante? Em (37) e (38), quem encontra-se na posição Comp da oração principal e subordinada, respectivamente, e o constituinte Q em que restaurante encontra-se na posição básica que ocupa em estrutura-D (in situ). Repare-se agora que a resposta adequada a (37) envolve uma espe cificação de pares (de pessoas e de restaurantes), e não apenas de pes soas. Por exemplo, (39a) é uma resposta possível a (37), mas (39b) não é: (39) a.
O Manel jantou no Spago, o Eduardo no L’Orangerie e o Carlos no Ma Maison. b. I O Manel, o Eduardo e o Carlos.
De um modo semelhante, em (38) o que me é perguntado é uma especifi cação de pares, como em (37), e não apenas uma lista de pessoas. A interpretação de (37) e (38) sugere que em LF o constituinte Q que restaurante é efectivamente um quantificador ligando uma variável, tendo escopo sobre a oração principal em (37) e subordinada em (38). Segundo Huang, como já vimos, este facto é captado através da aplicação de Mover wh em LF. As representações LF de (37) e (38) são pois as seguintes (visto que existe uma única posição Comp, Chomsky (1981) sugere que o movimento wh em LF do constituinte Q in situ numa interrogativa múltipla é tecnicamente uma adjunção à esquerda de Comp):
(i) a.
Wo xiang-zhidao [Lisi mai-le sheme). eu pergunto-me Lisi comprou o quê b. * Eu pergunto-me a Lisi comprou o quê. c. Eu pergunto-me [o que [a Lisi comprou]].
Existem várias possibilidades teóricas para dar conta deste paradigma, cuja discus são nos levaria demasiado longe no âmbito deste livro. Ver, entre outros, Chomsky (1973) e Lasnik e Sai to (1984). 153
1
em
b. ele perguntou-me [s, [s r, jantou em f,]]
t
[que restaurante]2 [Comp quem,]]
A possibilidade de aplicar Mover wh na Forma Lógica levanta a ques tão de saber se também Mover NP se pode aplicar nesta componente. Vol tamos a este problema no capítulo 17.2.7.
8. O estatuto de LF nos sistemas cognitivos Para além das propriedades quantificacionais das orações, compete à Forma Lógica representar as propriedades semânticas que são determina das pela estrutura sintáctica das orações. Entre estas contam-se as relações de co-referência entre argumentos (ver o capítulo 8), a relação sujeito-predicado, e as funções semânticas (temáticas) dos argumentos da frase, como Agente, Paciente, Causa (ver o capítulo 9). Estas propriedades, evidente mente, não esgotam os conhecimentos do falante/ouvinte sobre a signifi cação da linguagem e o seu uso adequado. Alguns aspectos deste sistema de conhecimentos não representados em LF são, por exemplo, o significa do de dicionário das palavras, a coesão discursiva e o uso adequado da linguagem em situações concretas. A TRL não nega a importância destes elementos (e a necessidade de os estudar sistematicamente), propõe que não pertencem ao sistema gramatical, formal, da linguagem. Estes aspectos da significação exteriores a LF têm eventualmente de ser combinados com as propriedades semânticas representadas em LF para obter não só a interpretação global das frases como também a capacidade 154
de as ligar cnlre si no discurso e de as utilizar de um modo pragmaticamente adequado, O nível de representação LF é assim o ponto de contac to da gramática formal com outro» sistemas cognitivos que contribuem para a interpretação da linguagem e para o seu uso adequado em situações con cretas, tais como o sistema da «competência pragmática», o sistema de crenças e pressuposições que os falantes têm sobre o mundo que os ro deia (provavelmente passível de variação cultural), e um nível de «repre sentação semântica» que inclui o significado dos itens lexicais bem como a caracterização das relações de sinonímia, paráfrase, analiticidade, impli cação linguística, etc. Este estatuto do nível LF como ponto de contacto entre a gramática e sistemas cognitivos extragramaticais é paralelo ao estatuto do nível de Re presentação Fonética (PF) (a saída da componente fonológica da gramática) como ponto de contacto entre a gramática formal e os sistemas motores e perceptuais que estão na base, respectivamente, da pronunciação concreta da linguagem e da sua percepção auditiva. 9. O m odelo bifurcado de Chomsky e Lasnik (1977) As investigações posteriores a Chomsky (1965) sobre as propriedades semânticas gramaticalmente determinadas mostrou que a informação estrutural pertinente para a sua derivação se encontra na estiutura-S, e não na estrutura-D das orações. Mesmo a determinação das funções semânticas, que pressupõe crucialmente o conhecimento das funções gramaticais dos argu mentos em estrutura-D (ver os capítulos 9 e 10 para uma discussão deste ponto), pode ser derivada a partir da estrutura-S através da presença dos vestígios neste nível de representação. Considere-se, por exemplo, a seguinte oração passiva: (41) O juiz foi insultado pelo polícia. Um dos aspectos da interpretação de (41) consiste no facto de o NP o juiz (o sujeito da frase) desempenhar a função semântica de Paciente da acção descrita pelo verbo insultar. Com este verbo, no entanto, a função semântica em questão encontra-se associada ao argumento que em estrutura-D mantém a função gramatical de objecto directo, e não ao argumen to com a função gramatical de sujeito (o qual é o Agente semântico): (42) O polícia insultou o juiz. A estrutura-S (43) permite recuperar a informação de que o NP o juiz é 155
o Paciente, porque este NP se encontra associado a um vestígio t (com ele co-indexado) na posição de objecto directo, que é aquela relevante para a interpretação semântica do NP como Paciente: (43) [s [OT o juiz], Infl [yp foi insultado | | t], pelo polícia]] A teoria dos vestígios permite pois codificar na estrutura-S das orações a informação sobre a função semântica dos argumentos, removendo o último obstáculo a que o nível LF seja derivado directamente do nível de repre sentação estrutura-S (l3). De novo podemos observar aqui o paralelismo com o nível de Representação Fonética, também ele derivado directamente a partir da estrutura-S. O modelo gramatical resultante desta articulação entre os vários ní veis de representação da gramática foi proposto pela primeira vez em Chomsky e Lasnik (1977), e é por vezes chamado modelo bifurcado (es quema adaptado de Chomsky (1986b)): X (Compl)*
A presentam os seguidam ente exem plos para cada um a das categorias lexicais p rincipais (a estrutura de X ’ é representada através de um a parentetização etiquetada, 1 colocam os os complementos em itálico):
(*) A classe adicional dos adjuntos e a sua inserção no esquema da teoria X-barra é discutida no capítulo 7.2. (?) Os parênteses curvos que encerram o símbolo Compl (abreviatura de Complemen to) indicam a sua facultalividade estrutural: como vimos no capítulo 3, determinados itens lexicais não subcategorizam complementos; o asterisco * simboliza aqui a possibilidade de ocorrência de mais do que um complemento na estrutura de X ’.
168
(26) Verho a. A criança (v. destruiu [Np o brinquedo)]. b. A criança [v, sorriu ao pai]). c. Eu | v. pedi (pp â Maria) ls. que trouxesse o livro]]. (27) Nome a. O [N. autor [n do livro]] é meu amigo. b. As [N. fotografias \n dessa paisagem}] são bonitas. c. A [N, ideia [s. (de) que o problema é insolúvel]] é atroz. (28) Adjectivo a. Isso é [A, útil [pp para o país]]. b. Ele é [A. responsável [s. (de/por) que a sessão comece]]. c. Eu estou [A. orgulhoso dos meus filhos]]. (29) Preposição a. Ele foi [p, com [N1) a JoanaJ]. b. Ele está [p. atrás do sofá]]. c. Ele saiu [p, sem [s. que a Maria saiba]]. 4.2.
A projecção X ”
A projecção sintáctica de nível 2 é obtida através da composição da categoria X ’ (resultante da primeira projecção) com o especificador da ca tegoria lexical, e designa-se através da notação X” (V” , N ” , A ” e P ” ). Os especifícadores são modificadores não subcategorizados das categorias lexicais, e ocorrem (em Português) à esquerda do núcleo lexical. A con figuração esquemática que resulta desta composição é ilustrada em (30); a regra que a define é dada em (31) (repare-se que a projecção X ” corres ponde ao constituinte XP da notação tradicional) (,0):
(10) Utilizamos o termo «Spec» para designar uma posição estrutural, e o termo «especi ficador» para designar a expressão lexical concreta que ocupa essa posição. Chomsky (1970) admite apenas a ocorrência de um único especificador em cada categoria sintagmática (con trariamente à possibilidade de ocorrência de mais do que um complemento em X’). Em Chomsky (1986a), no entanto, a regra que caracteriza a categoria X” permite uma se quência de n especifícadores. Este aspecto da regra é controverso. Para uma aproxima ção a esta questão de um modo algo diferente, ver o capítulo 7.3. 169
X*
(Spec)
(31) X**------> (Spec) X' Cada categoria lexical possui um sistema de especificadores constante, isto é, não existe variação significativa entre os itens de uma dada cate goria lexical quanto ao(s) especificador(es) que tomam (isto deve-se ao facto de os especificadores não serem subcategorizados). A natureza dos especi ficadores, no entanto, varia de categoria lexical para categoria lexical. Esta situação é exactamente oposta à dos complementos subcategorizados, que apresentam variação de item para item dentro de cada categoria lexical principal (por exemplo, optar subcategoriza um complemento distinto do de preferir, etc.), mas em que as mesmas categorias sintagmáticas (S \ NP, PP, etc.) podem ser complemento de qualquer categoria lexical. Finalmente, o especificador, tal como os complementos, é um elemento facultativo na estrutura das categorias sintagmáticas, embora existam restrições de co-ccorrência entre especificadores particulares e categorias lexicais particu lares, como por exemplo entre a categoria Det e a categoria N em certas posições da frase. Na teoria X-bazra de Chomsky (1970) não existe uma análise explícita e detalhada do sistema de especificadores das várias categorias lexicais prin cipais. Chomsky sugere que o sistema de especificadores de N inclui os determinantes (D), que o sistema de especificadores de A inclui as estruturas comparativas e os advérbios de grau, e que o sistema de especificadores de V inclui os verbos auxiliares e os morfemas de tempo e acordo. Mui tas destas hipóteses fixam posteriomiente postas em causa, em particular no que respeita aos determinantes e ao sistema flexionai dos morfemas de tempo e acordo. Em van Riemsdijk e Williams (1986) sugere-se que cer tos advérbios de foco ou de quantidade (como até, muito) podem funcio nar como especificadores das categorias lexicais principais (")• Apresenta mos a seguir alguns exemplos, com uma análise directamente baseada nestas sugestões de Chomslcy (a estrutura de X” é dada em forma de parentetização etiquetada, e colocamos os especificadores em itálico; Q = Quantificador e Aux = Auxiliar): {'*) Para uma discussão mais completa dos vários sistemas de especificadores, ver Radford (1988) e, para o Português, Mateus et al. (1989).
Üfl
0 2 ) Nome a. I., |„ ü \ i.j autor 4o livro]) desapareceu. b. L.. L Vário»] {r euudaniet)) chcfiram. c. Ele insultou crianças]].
(33) Verbo a. O Paulo [y.. b. O Vasco [v„ c. O Tiago (y..
maí\ L*. tocou aos bibelots]]. tem\ lido muitos livros)]. até] 1*. trouxe o letógio]).
(34) Adjectivo a. Ela está [A„ muito) [A. zangada com o João]]. b. Esse cano é [A„ verdadeiraaeute] (A. bonito]]. c- [A.. [xá» Até] [A. veloz]] essa moto é. (35) Preposição a. Ele acertou com a seta (no alvo). b. O João sai até]
mesmo]
[r em o alvo]]
com a Jófia]].
Apresentamos a seguir a representação em árvore dos sintagma* rele vantes dos exemplos (32a)-(35a) (consideramos que advérbios como muito, mesmo, etc., se encontram dominados por uma categoria siniagmática Adv’’ (=Sintagma Adverbial), à semelhança das outras categorias lexicais):
171
c.
A"
zangada
d.
P“
com o João
Chomsky sugere que em Inglês um NP pode funcionar como especificador da categoria lexical N, contrariamente às línguas românicas: (37) a. [ , . John‘s translation of the book]] b. * [^. o João [jj, tradução do livro]] jj
Devido a esta propriedade, existe em Inglês um paralelismo entre a estrutura do NP e a estrutura da Frase, como se pode ver através da comparação de (37a) com (38): (38)
[s John [y. translated the book]].
No capítulo 7 voltamos a este paralelismo. Notemos no entanto de passa gem que tanto em Inglês como em Português, o sujeito lógico de um NP que tem como núcleo um N deverbal ou proposicional pode ocorrer à direita deste N, aparentemente dentro de N \ e realizado através da categoria PP (tendo como núcleo uma das preposições por (by) ou de (of)): (39)
a. 1^, a [£, tradução do livro [por [o João\]\\ b. I [K„ the | | translation of the book [by [John]]}] c. B a [N. prenda [de o João] à Maria]] d. [K„ the | | gift [of John] to Mary]]
4.3. O estatuto das regras da teoria X-barra Convém esclarecer a natureza das regras (25) e (31) (aqui repetidas por conveniência em (40)), e em particular dos símbolos Spec e Compl que nelas ocorrem. 172
(40) i, ii.
X” ------> (Spec) X* X* ------> X (Compl)*
Estas regras são na realidade esquemas de regras', por outras palavras, não são em si mesmas regras de gramáticas particulares, ames representam a forma geral que as regras da componente categoríal devem tomar nas gra máticas particulares das línguas humanas. Nesse sentido, são uma contri buição decisiva para restringir a forma possível da componente de base da gramática. Na teoria de Chomsky (1970), as gramáticas individuais possuem por tanto regras particulares que obedecem a estes esquemas. Nessas regras os símbolos Spec e Compl são substituídos pelas categorias gramaticais que podem funcionar como especificador e como complementeis). Do mesmo modo, em cada uma dessas regras, a variável X é substituída por um símbolo constante que corresponde a uma das categorias lexicais principais. A se guir, apresentamos um pequeno conjunto ilustrativo destas regras ((41iii) válido apenas para o Inglês): (41) (i) (ii) (iii) (iv) (v)
V” ------ > (AdvP) N” ------ > (D) N” ------ > (NP) A” ------ > (AdvP) P” ------ > (AdvP)
V* N5 N’ A’ F
]
((PP)) ](NP)[ V(S*) 5
(42)
(iv)
------1 P
Na teoria X- barra, Spec e Compl são unicamente noções funcionais, a par das noções de sujeito, predicado, núcleo, etc., e recebem o mesmo tipo 173
de defmiçlo que estas categorias (Y é uma variável sobre categorias gru mnticins lexicais ou sintagmáticas, e y * x): (43)
E sprctficador de X
A categoria Y imediatamente dominada por X” [Y, X” ] (44)
Com plem ento d e X
A categoria Y imediatamente dominada por X’ [Y, X’]
4.4 . ProjecçSo máxima e núcleos de uma projecção
Consideremos a configuração abstracta (45) determinada pela teoria X-barra: (45) Spec
Compl A projecção máxima de uma determinada categoria lexical (notação «X™“») é a categoria de nível hierárquico mais elevado que a categoria lexical prcjecla, ou seja, é a projecção com um número mais elevado de barras. Na teoria proposta em Chomsky (1970), a projecção máxima de uma categoria lexical X é a categoria X” (I2). A projecção máxima de uma categoria X corresponde ao constituinte XP da teoria da estrutura de constituintes tradicional. Uma das convenções nolacionais frequentemente utilizada na literatura generativista consiste assim em utilizar o símbolo XP para designar a projecção máxima de uma categoria lexical X (NP em vez de N™*; VP em vez de Vmax; PP em vez de Pmax; e AP em vez de A""*). Neste livro seguimos essa convenção, a menos que, por qualquer motivo, seja importante representar o número de barras da projecção máxima.
(I2) A noção de projecção máxima 6 exlremamente importante para a formulação de certos princípios centrais do modelo da Regência e Ligação, e encontrá-la-emos frequente mente no decorrer deste livro.
174
Numa teoria X-barra com dua* projecçõe», í possível definir duas noções funcionai» de núcleo, respectivamente núcleo de X' e núcleo de X":
(46) N úcleo de X ' A categoria lexical Xo imediatamente dominada por X* ([X*. X*j;
(47) N úcleo de X ” A categoria X’ imediatamente dominada por X” ([X’, X”Jt Considera-se igualmente que a categoria lexical X9é o núcleo da projecção máxima X” . Na teoria X-barra de Chomsky (1970), cada núcleo situa-se num nível com menos uma barra do que a categoria imediatamente dominante (Pullum (1985) chama a esta propriedade sucessão). Os dois esquemas (25) e (31) podem ser caracterizados através do esquema (48), que incorpora a propriedade da sucessão: (48) Xn ----- > ... X*1 ... (n um número positivo) Como veremos no capítulo 7, a propriedade da sucessão não é uma carac terística necessária da teoria X-barra.
4.5. Uniformidade Na teoria X-barra de Chomsky (1970), as únicas categorias que projectam (isto é, que obedecem ao princípio de endocentricidade) são as ca tegorias lexicais principais V, N, A e P. As categorias lexicais menores como Determinante, Possessivo, Quantificador, ou os morfemas flexionais de tempo/acordo (assim como certos advérbios, ou os adjectivos atributivos em posição pré-nominal) por outro lado, funcionam como especificadores das categorias lexicais principais. Esta situação é parcialmente alte rada em Chomsky (1981), onde se propõe que as categorias gramaticais Infl e C(omp) também projectam (ver o capítulo 7). Na teoria X’ de Fukui e Speas (1986) determinadas categorias gramaticais «menores» também pro jectam, embora de modo diferente, como veremos também no capítulo 7. Na teoria de Chomsky (1970), o número máximo permitido de barras é o mesmo para todas as categorias que projectam. Uma teoria X-barra com esta propriedade diz-se uniforme (termo proposto por Pullum (1985)). A uniformidade, no entanto, não é uma característica necessária da teoria X-barra. É possível conceber uma teoria alternativa em que a projecção máxima das categorias lexicais seja variável, ou seja, em que o número 175
tná\tnu> do barres varie de categoria lexical para categoria lexical. Por exemplo, se uma determinada categoria lexical X não possuir um sistema dc expecificadores. não projectará o nível X " — a sua projecção máxima será X'. Uma teoria deste tipo 6 proposta, entre outros, por Fukui e Speas (1986) (ver o capítulo 7.3.). Na teoria de Chomsky (1970), o número máximo de barras que pode ser projectado é de dois: todas as categorias projectam o nível X ’ (por associação com os seus complementos) e o nível X” (por associação de X ’ com um especificador). Esta restrição não é aceite por todos os generetivistas. Num estudo extremamente detalhado da estrutura de constituin tes, Jackendoff (1977) propõe um sistema em que cada categoria lexical principal possui três projecções. Repare-se que a questão do número máximo de barras permitido é independente da questão da uniformidade. A teoria de Jackendoff é diferente da de Chomsky em propor um número máximo de três barras, mas é idêntica quanto à uniformidade (todas as categorias projectam uniformemente projecções máximas de três barras). A teoria de Fúkui e Speas (1986), por outro lado, é diferente da de Chomsky em não obedecer à uniformidade, mas é idêntica quanto ao número máximo de barras permitido (dois).
4.6. O quadro de subcategorização das categorias lexicais Na teoria X-barra, o constituinte relevante para a definição do quadro de subcategorização de uma categoria lexical é X’, e não X ” (visto que X ’ é a projecção que contém X e os seus complementos, com exclusão de outros modificadores). No capítulo 3, apresentámos o VP como o cons tituinte relevante para a definição do quadro de subcategorização dos ver bos (ver o princípio da subcategorização (17) desse capítulo). À luz da teoria X-barra, vemos que o constituinte relevante é na verdade V ’, e não VP. O princípio da subcategorização pode portanto ser reformulado (e genera lizado a todas as categorias lexicais) do seguinte modo: (49)
P r in c íp io d a S u b c a te g o r iza ç ã o
Um constituinte é subcalegorizado por uma categoria lexical X sse é imedialamenle dominado pela projecção X ’ que tem X como núcleo. O princípio (49) pode aparentemente ser desobedecido nos casos em que um a projecção máxima não contém um especificador, se aceitarmos uma sugestão de Chomsky (1986a) relativamente à estrutura de tais exem plos. Veja-se em primeiro lugar que a presença de um especificador é 176
opcional numa projecção máxima (lendo mesmo a situação não marcada para as categorias A, P e V):
(50) a. Ela vende (N.. \w fotografias [de artistas]]]. b. Ela [v„ | v comeu [o bolo]]]. c. Ela saiu \ r . \v com (o João]]]. d. Ela foi [A„ [., capaz [de levantar a cadeira]]]. Na teoria X-barra de Chomsky (1970) estes constituintes são considerados projecções máximas (de duas barras) visto que as suas propriedades sintácticas não são diferentes das de constituintes semelhantes contendo um especificador (ver Radford (1981; 1988) para alguns argumentos nesse sen tido, e Fukui e Speas (1986) para uma posição contrária, que apresenta mos no próximo capítulo). Repare-se agora que em (50) a categoria X” não ramifica, dominando exclusivamente X’. Chomsky (1986a) sugere que nestes casos, X’ (e não X” ) pode estar estruturalmente ausente (por razões que não elaboramos aqui). As estruturas de (51) representam pois uma análise possível destas expressões (de acordo com a notação referida acima, es crevemos XP em vez de X” ) (,3). Para compatibilizar o princípio (49) com esta proposta de Chomsky, podemos reformulá-lo do seguinte modo (n em (52) representa um número positivo; ver o capítulo 2 para a noção de (nó-) filho): (52) Princípio da subcategorização Um constituinte é subcategorizado por uma categoria lexical X sse é imediatamente dominado pela projecção X* que tem X como filho. Suponhamos agora que uma projecção sintagmática contém a categoria lexical e um especificador, mas não contém complementos. Neste caso, assumimos que a categoria X’ é projectada. ainda que não ramifique. Por detrás deste pressuposto está a ideia de que a categoria Spec apenas projecta X” quando se combina com uma categoria X’. Assim, temos as representações dadas em (53 a.b.c.):
O3) Repare-se como as representações de (51) são semelhantes àquelas atribuídas a estas expressões pela teoria da estrutura de constituintes tradicional. Esta semelhança é ilusória, contudo, visto que é um puro acaso resultante dos princípios da teoria X-barra e de certas convenções notacionais. 177
N
PP
fotografias
de artistas
c.
pp
I
o bolo
d.
P com
V
A
zo João x
capaz
AP
S’
de levantar a cadeira
desmaiou
estudantes
Cf
verdadeíramente
A
i bonito
5. A teoria X-barra de Stowell (1981) Ainda que não constitua uma alteração radical da teoria X-barra de Chomsky (1970), o modelo proposto por Stowell (1981) apresenta uma série de desenvolvimentos e sistemadzações importantes da teoria de Chomsky. O objectivo fundamental de Stowell consiste em construir uma teoria da componente de base da gramática que permita eliminar as regras categoriais específicas nas gramáticas particulares. Se bem que este objectivo não seja aí completamente alcançado, as propostas de Stowell são de impor tância fundamental para a construção de um modelo gramatical mais res tritivo e, logo, de maior plausibilidade biológica, isto é, mais facilmente capaz de dar conta da aquisição da linguagem. Apresentamos em (54) a lista das propriedades que caracterizam a teoria X-barra de Stowell: (54) Teoria X-barra de Stowell (1981) Obedece ao princípio da Endocentricidade. i. ii. Obedece ao Princípio da Uniformidade iii. Obedece ao princípio da Sucessão. 0 número máximo de barras é dois. iv. Os complementos ocorrem no nível X’. V. Os Especificadores ocorrem no nível X” . vi. vii. Só projecções máximas podem ocorrer em posições não nucleares. viii. Possui regras categorialmente neutras (Tese do Paralelismo). 179
ix.
x.
X o ocorre sempre numa das fronteiras de X ’, e a sua
posiç&o é susceptível de parametrizaçSo. Os esquemas da teoria X-barra têm como âmbito apenas as relações de dominfincia; as relações de precedência (a ordem linear entre constituintes), onde existem, são deriváveis de outros princípios da teoria gramatical.
As propriedades (54i-vi) (que caracterizam igualmente o modelo de Chomsky) já foram discutidas na secção anterior. As propriedades (54vii-xi) são discutidas nas subsecções seguintes.
5.1. As posições não nucleares numa configuração X-barra Consideremos de novo o esquema abstracto de uma configuração X-barra em (55). Na sequência de Jackendoff (1977), Stowell (1981) pro põe a seguinte hipótese: (56)
C o n d iç ã o S o b r e a s P o s iç õ e s N ã o N u c le a r e s
As posições não nucleares de uma configuração X -barra apenas podem conter projecções máximas. As posições não nucleares de uma configuração X-barra são aquelas ocupadas pelo especificador e pelos complementos. A condição (56) de termina pois que estes elementos, quando ocorrem, são sempre projecções máximas. Do ponto de vista da aquisição da linguagem, esta condição determina uma teoria gramatical extremamente restritiva, dado que exclui à partida toda uma série de estruturas a p r i o r i possíveis em que as posi ções de Spec e Compl se encontrariam preenchidas por projecções não máximas (por categorias lexicais, ou por projecções intermédias). Trata-se agora de saber, evidentemente, se a condição (56) encontra suporte nos dados empíricos. No que diz respeito aos complementos, a condição (56) é totalmente satisfeita. De faclo, não parece haver nenhum caso em que o complem en to de um a categoria lexical não seja uma projecção máxima. Repare-se que a condição obriga a considerar a categoria S’ como uma projecção máxima, logo, com o uma categoria endocêntiica (a par de NP, PP, etc.). No capítulo 7, verem os que S ’ é na realidade uma categoria com essa propriedade. No quadro das propostas de Chomslcy (1970), a condição (56) encon tra no entanto problemas consideráveis quanto 1 categorização gramatical do sistem a dos especificadores. Consideremos por exemplo a categoria D e term inante), tida como sendo o especificador de N. A condição (56) obri180
ga a considerar que o item o em o rapaz saiu, para além de ser categori zado como D, se encontra dominado por uma (hipotética) categoria D” (Grupo de Determinante), como em (57):
Ora a categoria D ” , se existe, deve poder tomar um especificador e (pelo menos) um complemento. Nesta perspectiva, talvez seja possível analisar o sistema dos Quantificadores (Q) como especificadores de D, em expres sões como as seguintes: (58)
a. b.
Todos
os rapazes saíram. dos rapazes saíram.
A lg u n s /v á r io s
É menos claro, no entanto, qual a categoria que funciona como comple mento de D numa estrutura do tipo de (57). (No capítulo 7, propomos uma teoria X-barra alternativa em que a categoria D projecta, embora numa con figuração diferente de (57).) Tomemos outro exemplo. A categoria N pode em Português ser modi ficada por adjectivos atributivos ocorrendo em posição pós-notninal, como em (59): 181
(59) i. Um velhote o r g u lh o s o foi passear. b. Um velhote muito o r g u lh o s o com os seus netos foi passear. (59b) mostra que nesta posição o modificador adjectival é uma projecçflo máxima, dado que se encontra flanqueado por um complemento (com os seus netos) e por um especificador (m ulto) (em (59a) a projecçfio máxima tuljectíval contém apenas o adjectivo). Mas consideremos agora o caso em que o adjectivo atributivo se encontra em posição pré-nominal: (60)
a. Um orgulhoso velhote apareceu à minha frente. b. * Um muito orgulhoso com os seus netos velhote apareceu à
minha frente. A não gramaticalidade de (60b) mostra que nesta posição o modifica d or adjectival é uma categoria lexical que não projecta. Os adjectivos atributivos não são complementos, visto que não são subcategorizados pelo nome (nem são necessários para «completar» o seu significado, nem existe variação dentro da categoria N relativamente à pos sibilidade de os tomar ou não como modificadores). Se os considerarmos especificadores (pondo de parte a questão de ocorrerem à direita do nome em (59), um a posição não canônica para um especificador em Português) surgem no entanto problemas evidentes com a condição (56), dado que em posição pré-nominal os adjectivos, como vimos, não são projecções m á x i m a s (nem intermédias). Em síntese, aquilo que se sabe sobre os complementos das categorias lexicais não levanta problemas para a condição (56); as sugestões concre tas sobre especificadores da teoria X-barra de Chomsky (1970), no entan to , parecem ser dificilmente compatíveis com essa condição. A alternativa é clara: ou abandonamos a hipótese (56), por ser demasiadamente restriti va, ou desenvolvemos um quadro de hipóteses diferente sobre o sistema de especificadores das categorias lexicais (em que, por exemplo, nem os-de term inantes nem os adjectivos sejam especificadores). Os desenvolvimen to s m aís recentes da TRL no domínio da teoria X-barra apontam para esta direcção {COmo veremos no capítulo 7), permitindo assim a priori manter a condição (56) de Stowell.
5 .2 . S u b categ o rização de n ú cleo a núcleo Se o prm cípio’'(á6) determina que os complementos são projecções
máximas, toma-se, redundante representar esta informação no quadro de subcategorização das entradas lexicais. Stowell (1981) sugere que os qua182
dro» de subcategorização apenas representam o núcleo X* das categorias subcategorízadas. Nesta perspectiva, a subcategorização 6 na realidade uma relação entre núcleos lexicais, de núcleo lexical subcategorizador a núcleo lexical subcategorízado. O facto de os complementos serem protecções máximas dos núcleos subcategorízados é inteiramente determinado pelo princípio (56). Repetimos aqui as entradas lexicais apresentadas no capítulo 3 com a indicação apenas do núcleo no quadro de subcategorízação. Mantemos a categoria S’ em (61f,g) porque ainda não discutimos a sua inserção na teoria X-barra (ver o capítulo Tf. (61) a. b. ; c. d. e»
arrumar. abrir. optar. escrever. trabalhar.
V ,__ V,__ V___ V,__ V.
N ([p loc]) N (ÍPpor]) (N) (íf a])
í lp pot] ) J g g perguntar. V ,__ ([P a]) l } (t+ W H ]) g- declarar.
v | | | | (ÍP a])
h. parar: '
p, _J_
[y -WH] ÍN ) (ly "WH]}
J Lrj píto; 'a i g U fiel; ,
A ,_ _ A, _ ([p a])
5>3:. Regras categorialmente neutras A proposta central do modelo de Stowell é de que os esquemas uni versais da teoria X-barra são (necessários e) suficientes para dar conta da variedade das estruturas-D das línguas particulares, se forem devidamente articulados com condições e princípios independentes da gramática univer sal. Para atingir este objectivo, Stowell propõe que os esquemas univer sais sejam formulados em termos categorialmente neutros, empregando unicamente variáveis: (62) (i) X” —■—> (YP) X’ (regra do especificador) (ii) X’ ------> X (ZP)* (regra dos complementos) Os esquemas categorialmente neutros de Stowell podem receber uma 183
interpretação «fraca» c uma interpretação «forte». Cadn uma delas tem implicações diferentes quanto ao problema da aquisição, Na interpretação fraca, o esquema (62) limita-se a especificar o formato que nx regras categoriais particulares das línguas humanas podem tomar. Nesta interpretação, o esquema categorialmente neutro de Stowell nflo tem implicações teóricas diferentes do modelo X-barra de Chomsky (1970) (independentemente da contribuição trazida pela condição (56)). Segundo esta hipótese, a criança traz para a aquisição da linguagem a informação inata de que as catego rias lexicais são endocêntricas. que projectam em dois níveis, que apenas projecçôes máximas podem figurar nas posições não nucleares, etc. No en tanto, tem que aprender no decurso da aquisição o conteúdo categoria! con creto de YP e de ZP* para cada categoria lexical X na língua específica que adquire (por exemplo, tem que aprender que quando X = N, Y = D, ou, em Inglês, YP = NP, etc.). Em síntese, tem que aprender o conjunto particular das regras categoriais da sua língua. A interpretação forte é de longe a mais interessante. Nesta interpretação, do ponto de vista dos esquemas da teoria X-barra, qualquer projecção máxima pode figurar nas posições de YP e de ZP*, ou seja, o sistema de especificadores e complementos é idêntico para todas as categorias lexicais (e para todos os itens dentro de cada categoria), admitindo todas as possi bilidades de realização categorial (chamamos à interpretação forte tese do paralelismo). Isto significa efectivamente que as regras categoriais parti culares das gramáticas individuais são totalmente eliminadas. Visto de outro modo, as gramáticas particulares não contêm uma componente categorial; esta pertence exclusivamente à gramática universal (sob a forma de (62)). Nesta interpretação, a aquisição encontra-se claramente facilitada, visto que não existem regras categoriais específicas que a criança tenha que adqui rir. A versão «absoluta» da tese do paralelismo é facilmente infirmável, dado que sobregera consideravelmente. Para dar um exemplo extremo, uma pro jecção máxima verbal não pode funcionar como especificador da categoria N, como (63a) mostra ((63a) podería ser a priori possível com a signifi cação da construção relativa (63b)): (63) a. * (íyp apanhou a bola] rapaz] atirou-a ao amigo. *b. [o rapaz que apanhou a bola] atirou-a ao amigo. As assimetrias entre línguas diferentes quanto às categorias que podem funcionar como especificadores levanta igualmeníe problemas à tese do pa ralelismo, e põe directamenle em causa a ideia de que não são necessárias regras categoriais particulares para caracterizar as estruturas-D. A assimetria $níre o Português e o Inglês quanto à possibilidade de a categoria NP 184
funcionar como ctpeciíicador de N é um exemplo desta situação (ver o contraste acima entre (37a) e (37b)). Na área dos complementos, a própria noção de subcategorização parece estar cm contradição com a tese do paralelismo. O miolo desta noção tem precisamente a ver com uma escolha idiossincrática de complementos por parte dos itens de cada categoria lexical (a escolha de preferir é diferente da de optar, etc.). A tese do paralelismo no entanto parece determinar que todos os itens lexicais têm (ou podem ter) o mesmo tipo e número de complementos. Na realidade, contudo, a tese do paralelismo não implica necessariamente nem que todas as possibilidades categoríaís se possam realizar no sistema de especificadores e complementos nem que exista um paralelismo abso luto entre as várias categorias lexicais quanto a estes sistemas. O facto de a componente categorial não ter poder de decisão sobre o conteúdo parti cular de Y P e ZP* em (62) não significa de modo nenhum que outras com ponentes ou princípios independentes da gramática não possam determinar o conteúdo dessas categorias. A sobrevivência da tese do paralelismo de pende assim cruciaimente da descoberta de tais princípios independentes. No âmbito da TRL, esta problemática define todo um programa de inves tigação ainda em progresso. No capítulo 7 voltamos a esta questão, no âmbito da versão da teoria X-barra proposta por Fukni e Speas (1986). 5.4. Parâm etros de ordem linear
Uma das teses centrais da teoria X-barra é de que as relações hierárquicas entre constituintes definidas pelos esquemas de (62) são universais, isto é, não variam de língua para língua. Por outras palavras, os especificadores são universalmente filhos de X” e irmãos de X’, e os complementos são universalmente filhos de X’ e irmãos de Xo (ver contudo as observações feitas acima na secção 4.6). A ordem linear entre esses constituintes, no entanto, está longe de ser universal, como uma observação rápida permite mostrar. Em Português e em Inglês, por exemplo, o verbo ocorre no início do VP, precedendo os seus complementos. Em Turco e em Japonês, contudo, o verbo ocorre no final do VP, a seguir aos seus complementos: (64) a. Turco (exemplo de Lehmann (1978)): Çocuklar fkazi gordu]. crianças ganso viram «As crianças viram o ganso»
183
b. Japonês (exemplo de Kuno (1978)): Taroo-ga [ Hanako- ni tegami-o kaita]. Taroo Nom. Hanako Dat. carta Ac. escreveu «Taroo escreveu uma carta à Hanako» O Português e o Inglês possuem preposições. Os itens lexicais correspon dentes às preposições em Turco e em Japonês ocorrem depois do comple mento NP, sendo chamados posposições (continuamos a utilizar o símbolo P para estes elementos): (65) Japonês: Sono otokono- wa [boo-de] inu- o butta. aquele rapaz Nom. pau com cão Ac. bateu «Aquele rapaz bateu no cão com um pau» Em Português, Inglês, Turco e Japonês, a posição canônica do sujeito de uma oração é no início desta. Em Malgache, contudo, a posição canônica do sujeito é no final da oração: (66) Malgache (exemplo de Keenan (1978)): Manasa lamba [ny zazavavy], lava roupas a rapariga «A rapariga está a lavar roupa»
__
Estes exemplos representam apenas alguns dos aspectos em que as línguas humanas podem variar no que respeita à ordenação dos constituintes. Outros pontos de variação incluem a ordem entre adjectivo atributivo e nome, a ordem entre verbo auxiliar e verbo principal, e a posição das partículas pronominais/adverbiais interrogativas (quem, como, etc.) nas orações interro gativas. Dado que a hierarquização entre constituintes é universal, mas a sua ordenação linear não é, toma-se necessário dissociar estes dois aspectos na formulação dos esquemas universais (62) da teoria X-barra. A proposta de Stowell é de que estes esquemas caracterizam apenas relações hierárquicas, sendo neutros relativamente às relações de ordem linear. Uma versão mais adequada desses esquemas é pois a seguinte (em (67), as chavetas {} encerram um conjunto não ordenado de elementos): (67)
(i) X ” -----> {X’, (YP)) regra do especificador (ii) X ’ 1-----> {X, (ZP)*] regra dos complementos
Os esquemas de (62) são demasiado rígidos visto que impõem uma 186
ordem linear unívcrealmente fixa, o que não corresponde à realidade lin guística. Os esquemas de (67), no entanto, sofrem do problema contrário, isto 6, são demasiado flexíveis, visto que permitem qualquer ordenação possível entre os constituintes (não só de língua para língua, como tam bém dentro de cada língua). Ora se existem na realidade línguas em que a ordem dos constituintes parece ser «livre», existem muitas outras, como o Português ou o Inglês, que impõem uma ordenação (pelo menos canônica) entre os seus elementos. Toma-se pois necessário incorporar na gramática esquemas de ordem linear que permitam caracterizar as ordenações possíveis nas línguas particulares. Uma questão primordial no âmbito da TRL é a de saber se estes esquemas possuem aspectos universais. Os esquemas de ordem linear, repetimo-lo, são independentes dos esquemas que caracteri zam a organização hierárquica dos constituintes, o que não significa, como veremos, que não possam ser formulados em termos das estruturas gera das por esses esquemas. Ainda que os factos da ordenação linear sejam complexos, existem regularidades importantes, que foram estudadas pelo linguista Norte-Ame ricano Joseph Greenberg num artigo de influência decisiva para a criação da teoria de parâmetros da TRL (Greenberg (1963)). Greenberg observou, entre outros aspectos, que as línguas em que o verbo precede o objecío ([V...O]) tendem a possuir preposições (isto é, a ordem dentro do PP é [P NP]); e que as línguas com a ordem [O V] (como o Japonês e o Tur co) tendem a possuir posposições ([NP P]) (M). No primeiro grupo de línguas, a ordem entre o nome ou o adjectivo e os seus complementos é [N Compl] e [A Compí], enquanto que no segundo grupo essa ordem é [Compl N] e [Compl A], Estas observações são extremamente interessan tes no âmbito da TRL, já que sugerem que a ordenação linear entre uma categoria lexical XoI os seus complementos é consistente de categoria lexical para categoria lexical, dentro de uma dada língua. Stowell (1981) observou que existe uma ordenação linear entre uma categoria lexical e os seus complementos permitida por (67ii) que parece no entanto não se verificar (pelo menos canonicamente) em nenhuma língua humana. Quando um núcleo subcategoriza mais do que um complemento, não pode ocorrer entre eles (IS):
(14) Utilizamos (de acordo com a terminologia de Greenberg (1963)) os símbolos V para verbo, S para sujeito e O para objecto. Estas observações de Greenberg estão in cluídas nos seus universais 3 e 4 (ver Greenberg (1963, 78-79)). Embora o seu universal 3 se restrinja às línguas VSO, é possível generalizá-lo às línguas SVO. (15) O primeiro asterisco de (68) indica que esta sequência não é permitida; ZP* e WP* designam um número arbitrário n de complementos de um lado e doutro de Xo 187
(6$) * iv z p * x" wp*] Ou veja, uma categoria Xo ocorre necessariamente numa posição adjacente â fronteira de X’. Parece plausível Incorporar estu observação na gramática universal através da seguinte condição: (69) Condição de Adjacência em X' O núcleo Xo de X’ ocorre sempre numa posição adjacente à fronteira de X \ Combinando as observações de Greenberg com a condição (69), conclui-se que a gramática universal permite apenas as linearizações (70i) e (70ii) para o esquema categorial (67ii): (70) (i) Xo Compl*] (ii) [x. Compl* X°j Stowell propõe que a gramática universal contém um parâmetro cujos valores são as duas linearizações (70i) e (7Gii) (16). Cada gramática parti cular escolhe um desses valores independentemente do conteúdo particular de cada categoria lexical Xo, e aplica-o consistentemente a todas elas. Do ponto de vista da aquisição da linguagem, este parâmetro implica que a aprendizagem da ordenação linear entre cada núcleo lexical e os seus com plementos se encontra grandemente facilitada. Segundo esta perspectiva, a criança tem apenas que ser exposta a expressões da sua língua que mani festem a ordenação linear entre uma das categorias lexicais e os seus com plementos; com base nessa observação particular, a criança está em con dições de fixar o valor do parâmetro (70), generalizando essa ordenação a todas as categorias lexicais da sua língua. Assim, por exemplo, a observa ção de que a língua à qual se encontra exposta tem preposições, e não posposições, permite à criança fixar o parâmetro com o valor [x, X Compl*] e daí concluir que a ordem entre V e Compl é [V Compl*] em vez de [Compl* V], | assim sucessivamente para as outras categorias lexicais. As línguas humanas têm tendência a ser consistentes na fixação do parâmetro (70). No entanto, existem casos de línguas com ordenações mistas, em que a ordenação entre uma dada categoria lexical e os seus comple mentos toma um valor diferente do das restantes categorias lexicais; ou mesmo em que itens lexicais diferentes de uma mesma categoria lexical
(,CJ Em Inglês, este parâmetro é chamado Head Parameter, ou Head First/Head Last Parameter. Em Português, podemos designá-lo Parâtneíro de Ordenação do Núcleo. 188
entram cm ordenaçõc* diferentes com o» seus complementos. O Holandês e o Alemão exemplificam estas duas possibilidades, dado que possuem esscncialmcnte um sistema de preposições (a par de algumas posposições). apesar de a ordenação linear canônica ser [x Compl* X]. Em casos como este, a gramática particular das línguas em questão tem de especificar que determinadas categorias lexicais têm uma opção marcada relativamente ao parâmetro (70) (isto é, uma opção diferente daquela efectuada a nível geral) (l7). A ordenação entre o especiftcador e X’ pode ser igualmente captada através de um parâmetro semelhante a (70). Numa teoria sintáctica em que apenas um especificador é admitido em X” (mas ver Chomsky (1986a, 2-4)), o número de linearízações logicamente permitido pelo sistema é ape nas de dois: (71) (i) [*.. Spec X’] (ii) [x„ X’ Spec] A gramática universal contém pois um parâmetro de linearização cujos valores são (71i) e (71ii), e cada gramática particular escolhe um valor, independentemente do conteúdo gramatical de X’. No pressuposto de que o NP sujeito é o especificador da categoria S (uma proposta que fazemos no capítulo seguinte), a escolha de (71i) produz línguas SVO ou SOV como o Português, o Inglês, o Japonês ou o Turco; e a escolha de (71ii) produz línguas VOS como o Malgache.
(17) As línguas VSO (Verbo-Sujeito-Objecto), como o Irlandês, apresentam proble mas de ordem linear cuja exploração se encontra para além do âmbito deste livro. Ver, entre outros, Sproat (1985). Trabalhos recentes da TRL apontam no sentido de uma divisão do parâmetro (70) em dois ou mais parâmetros de linearização mais primitivos, formu lados com base nas noções de Caso e de Função Temática que estudamos mais adiante (ver, por exemplo, Koopman (1984) e Travis (1984)). No quadro destas análises, a ex pectativa de que uma língua seja «rígida» (através das várias categorias lexicais) na fixação das ordenações dentro de X’ não é tão forte como na teoria de Stowell (1981).
189
Capítulo 7
Desenvolvimentos recentes da teoria X-barra
1. A integração das categorias Msicas na teoria X-barra U m dos desenvolvimentos recentes mais interessantes da teoria X-barra consistiu na integração sistemática das categorias fiásicas S e S* no esque ma universal da teoria X-barra. Consideremos de novo as regras que reescrevem estas categorias, è a estrutura Sraãca que resulta da sua aplicação:
MS• 1b.1
«Comp S -> NP Infl VP
C2)
Comp NP
Infl
VP
Tomemos em primeiro lugar a regra (lb). A notação utilizada nesta regra propõe implicitamente que S é uma categoria exocêntrica. Contrariamen te às regras que reescrevem as categorias NP, VP, AP e PP (onde a nota ção revela de modo transparente a sua natureza endocêntrica), não existe na regra (lb) nenhuma relação evidente entre qualquer das categorias à direita da seta e o nó S, tal que se possa dizer que S é uma piojecção dessa categoria. Quanto à regra (la), embora estabeleça uma relação aparentemente X-barra teorética entre S’ e S, levantam-se algumas questões quando a ten tamos interpretar. De facto, a regra propõe implicitamente que S’ é uma projecção de S, 0 que é no entanto contraditório com a notação utilizada. Recordemo-nos que uma categoria X’ tem como núcleo uma categoria lexical 191
\ de grau /cm. S. no entanto, nâo 6 uma categoria lexical; logo, de acor do com a teoria. S * niío pode ser uma categoria X \ uma contradição evi dente Uma alternativa consiste em interpretar $* como sendo uma cate goria X‘\ isto é, como sendo efectivamentc S” . Nesta interpretação, Comp é um especiílcador e S é na realidade S*. O sistema de regras (1) seria assim substitufdo pelo sistema mais apropriado (3), o qual deriva a confi guração (4): (3) a. S’* ----- > Comp S’ b. S* ----- > NP Infl VP U: filuo toma a regra de concordância supérflua. A indexação de Infl pode proceder livremente, dado que as estruturas em que não haja co-indexação de Infl com o sujeito são agora automaticamente excluídas.
246
antecedente tem de obedecer a determinada» condições estruturais. O mesmo se passa rclativsmcnte à relação entre um pronome e o seu antecedente. São essas condições que investigamos nesta secção. 4.1. Anáforas e pronomes próximos em distribuição complementar Comecemos por considerar o seguinte paradigma: (20) a. [A Maria], confia em [si própria\y b. * [A Maria], confia n[ela\y Em (20a), a anáfora si própria toma obrigatoriamente o DP a M aria como antecedente. Em (20b), no entanto, o pronome ela e o DP a M aria não podem referir-se à mesma pessoa, ou seja, o pronome não pode tomar o DP a M aria como antecedente, uma situação que é exactamente oposta à relação entre a anáfora e o DP em (20a). Note-se que a impossibilidade de (20b) na interpretação próxima mostra que os pronomes não possuem afinal de contas a liberdade completa de tomar qualquer valor referencial (especificamente, não podem tomar qualquer DP como antecedente). Consideremos agora o seguinte paradigma: (21) a. | [A Maria], pensa que o Luís confia em [si própria]t. b. [A Maria], pensa que o Luís confia n[ela]r A situação em (21) é exactamente a inversa de (20). Em (21), é agora a vez da anáfora si própria não poder tomar o DP a M aria como antece dente (ainda que as duas expressões concordem gramaticalmente), e de o pronome ela poder ser co-referente com esse DP. (Note-se que o uso obviativo do pronome não é afectado nem em (20) nem em (21): nos dois casos, o pronome pode tomar um valor referencial diferente do valor atri buído ao DP a Maria). Estes paradigmas sugerem a seguinte hipótese: (22) Relativamente a um dado antecedente, as anáforas e os pronomes próximos estão em distribuição complementar. A hipótese (22) afirma que, mantendo constante o antecedente (como em (20) ou (21)), as posições em que uma anáfora pode ocorrer são comple mentares (disjuntas) das posições em que um pronome próximo pode ocorrer. Em (20), a anáfora, o pronome e o DP estão contidos na mesma ora ção simples; em (21), pelo contrário, a anáfora e o pronome pertencem à 247
uraçèo fcubordinada, enquanto que o DP está contido na oração principal. K*U situação. juntamente com a hipótese (22), sugere as seguintes duas hipóteses? (23)
(i) Uma anáfora e o seu antecedente estão necessariamente contidos na mesma oração simples. (ii) Um pronome não pode ter um antecedente na mesma oração simples.
4.2. C -com ando e ligação A situação, contudo, não é tão simples como os paradigmas (20) e (21) sugerem à primeira vista. Consideremos em primeiro lugar o seguinte exem plo: (24)
* [Si própria]1 confia n[a Maria],.
Em (24), a anáfora encontra-se na mesma oração simples que o DP a M a ria, certamente satisfazendo (23i). No entanto, o DP não se qualifica como antecedente da anáfora. À primeira vista, parece que o que está em causa em (24) é a ordenação linear entre a anáfora e o antecedente potencial a M aria. A não gramaticalidade de (24) podería assim ser caracterizada adi cionando a cláusula (25ii) à condição (23i) (aqui repetida):256 (25)
(i) Uma anáfora e o seu antecedente estão necessariamente contidos na mesma oração simples. (ii) O antecedente precede a anáfora.
A condição (25ii) é no entanto suspeita, à luz de (26): (26)
[pp As fotografias de [ri própria], d[a Joana],] ficaram óptimas.
Em (26), a anáfora si p ró p ria tom a como antecedente o DP a Jo ana, ainda que este DP se encontre à direita da anáfora (o significado de (26) é aproxi madamente «as fotografias que a Joana tirou a si própria ficaram óptimas»). Se bem que esta frase não seja perfeita, é certamente aceitável (em con traste com (24)). Esta expressão é pois um contra-exemplo directo à cláusula (25Ü). Consideremos agora em particular (27) e as duas representações em (28) que este exemplo pode a priori receber ((29) é semelhante a (20b) e serve de «controlo» na identificação da interpretação possível de (27)): 248
(27) O amigo do João confia cm si próprio. (28) a. (O amigo d(o João],J2 confia em (sí próprioJ2. b. * [O amigo d(o João],]2 confia (em si próprio\x. (29) [O João], confia (em si próprio],. Em (28a), a anáfora si próprio toma como antecedente o DP sujeito da oração o amigo do João, em satisfação de (23i). Em (28b), a anáfora toma como antecedente o DP o João (contido dentro do DP sujeito), também em satisfação de (23i). No entanto, a única representação que recebe uma interpretação é (28a); a interpretação (28b), em particular, é impossível. Por outras palavras, o único DP que em (27) se qualifica como antecedente da anáfora é o DP mais inclusivo o amigo do João, na posição de sujeito da oração. Em particular, o DP o João, contrariamente a (29), não pode ser antecedente da anáfora. A impossibilidade de (28b) mostra pois que a condição (23i) é insuficiente para caracterizar a relação entre uma anáfora e o seu antecedente. Nos exemplos gramaticais apresentados, o antecedente da anáfora é o sujeito da oração (em (26), o DP a Joana pode ser tomado como sujeito do NP que tem como núcleo fotografias, numa posição de adjunção a este, como nas orações pequenas analisadas no capítulo 7). Poder-se-ia pensar que a condição relevante sobre o antecedente de uma anáfora é que este é necessariamente um sujeito. O exemplo seguinte, contudo, mostra que o an tecedente de uma anáfora não se encontra restringido à função de sujeito: (30) E necessário alguém proteger [os prisioneiros] ,de [si próprios],. Em (30), o DP os prisioneiros é o objecto directo da oração subordinada e funciona legitimamente como antecedente da anáfora si próprios. Existe uma diferença estrutural entre (28b) por um lado, e (28a) e (29), por outro lado, cuja exploração se revela mais proveitosa. Em (28a) e (29) o antecedente encontra-se numa posição estrutural mais elevada do que a anáfora, o que se pode ilustrar facilmente através dos diagramas de (31) (os antecedentes estão contidos dentro do círculo). A relação intuitiva (pré-teórica) «x é estruturalmente mais elevado do que y» recebe uma formulação precisa através da noção de c-comando, introduzida na teoria gramatical por Tanya Reinhart (cf. Reinhart (1976, ” 1983)):
249
(3 1 )
II*
•
r
(d v .
o João
1
VP
em (32)
C -com ando Um nó A c-comanda um nó B sse: W
A nã0 domina B e B n ão d om in a A ;
250
si próprio
fii) Qualquer nó ramificado que domine A domina iguaimente B í" ). Como ilustração da noção de c-comando, consideremos a seguinte es trutura: (33)
IP
P
DP,
De acordo com a definição (32), em (33) DP, (o sujeito) c-comanda todas as restantes categorias, visto que o único nó ramificado que o do mina (IP) domina igualmente todas as outras categorias da configuração sintáctica (e, crucialmente, DP, ele próprio não se encontra numa relação de dominância com nenhuma delas). V c-comanda DP,, PP, P e DP3, visto que os nós ramificados que dominam V (VP, I* e IP) dominam igualmente DP2, PP, P e DP, (e de novo não existe uma relação de dominância entre os nós em questão). V não c-comanda I visto que existe um nó ramifica do que domina V (VP) mas que não domina I (ainda que não exista uma relação de dominância entre V e I); e VP não c-comanda DP2, visto que existe uma relação de dominância entre eles (VP domina DP,), ainda que o primeiro nó ramificado que domina VP (I’) domine iguaimente DP2. Repare-se que a definição de c-comando implica em particular que dois nós estruturalmente irmãos (cf. o capítulo 2) se c-comandam mutuamente. Dada a geometria das configurações estruturais, é suficiente na com putação do c-comando verificar se o primeiro nó ramificado que domina A domina iguaimente B. Se esta situação se verificar, qualquer dos outros nós ramificados que dominam A dominam também B (12). A noção de c-comando formaliza pois a noção pré-teórica «estrutural(") Um nó ramificado é um nó do qual saem pelo menos dois ramos, isto é, que domina pelo menos dois outros nós. C2) Com base neste facto, algumas formulações do c-comando na literatura da gramática generativa mencionam na definição «o primeiro nó ramificado», em vez de «qualquer nó ramificado».
251
mcfttc nwds c io ado* (ou «no mesmo nível estrutural» — caso de nds umlmt. cutuindo crucialmente a situaçfio em que a maior olevuçfio es trutural sc dcvc a uma relação de domínio (através da cláusula (321)). Umà noção derivativa da noção de c-comando é a de domínio de c-VíWittuiq (de um dado nó):
(34) D om ínio de e~com ondo O domínio de c-comando de um nó A é o conjunto dos nós que A c-comanda. Regressando aos diagramas em (31). verificamos que o DP o amigo do Joio cm (31a) c-comanda a anáfora (o primeiro nó ramificado que o domina é IP, e este domina a anáfora); em (31b), contudo, o DP o João não c-comanda a anáfora. visto que existem três nós ramificados (PP, NP e DPJ que o dominam, mas que não dominam a anáfora. Em (31c), fi nalmente, o DP sujeito o Jo io c-comanda a anáfora. Estes factos sugerem a seguinte hipótese sobre o licenciamento de uma anáfora: (35) C on dição d o c~com ando so b re a s an áforas Uma anáfora possui necessariamente um antecedente que a c-comanda. Vejamos brevemente como os restantes exemplos apresentados nesta secção satisfazem a condição do c-comando. Em (24), o antecedente ria está dentro do VP, e não c-comanda a anáfora na posição de sujei to (lí). Quanto a (26), propomos a representação (36) para o DP sujeito dessa oração. Esta estrutura incorpora as seguintes duas hipóteses: em pri meiro lugar, que a preposição de pode ser «ignorada» na computação do c-comando entre a expressão da Joana e a anáfora, ou seja, que a expressão da Joana em (36) é na realidade um DP, e não um PP (a motivação para tratarmos de como «transparente» em (36) é apresentada no capítulo 12.4.); em segundo lugar, que este DP é um adjunto do NP complemento do Determinante as. Estas duas hipóteses determinam a configuração de c-comando necessária entre o DP da Joana e a anáfora para permitir que a anáfora tome esse DP como antecedente, ainda que a anáfora o preceda (o primeiro nó ramificado que domina o DP da Joana domina igualmente | anáfora). Em (30), finalmente, o DP os prisioneiros dentro do VP c-comanda 1 anáfora, ela própria também dentro do VP, como se mostra em (37). (,51Ko capítulo 15, veremos que este exemplo é excluído independentemente por uma condição que teguU a distribuição das expressões-R. 252
K cpirM e que o inverso não é verdadeiro, isto é. o DP dentru àó PF nflo e«comanda o DP objecto directo (o primeiro nó ramificado que domi na o DP (PP) nâo domina o DP objecto directo). Isto permite predi/er que as posições do antecedente e da anáfora não se podem trocar em (30), pre visão essa íntetramente correcta:
(38) * É necessário alguém proteger si próprios dos prisioneiros. Definimos agora o conceito de ligação, combinando a noção de c-comando com a noção de antecedente (8): (39) Ligação Uma categoria A liga uma categoria B sse: (i) A é co-indexado com B; e (ii) A c-comanda B. Uma definição derivativa de (39) é a de ligação local: dizemos que uma categoria A liga localmente uma categoria B sse A liga B e não existe nenhuma categoria X tal que A ligue X e X ligue B. Se tal categoria existe. 253
A tigtt B, mus não liga B localmente, visto que entre A e B intervém X (ver mais à trente em (65) a definição do conceito de intervenção em ter mos de c-comando). Podemos agora combinar a condição do c-comundo sobre as unáforas com a hipótese (23i), em termos de noção de ligação (14): (40)
Uma anáfora é ligada dentro da menor oração que a contém.
A ligação é uma conjunção dos requisitos de c-comando e de co-indexação. Assim, por exemplo, a representação (28b) é formalmente excluída pela condição (40) porque não há maneira de satisfazer a conjunção: o DP o am igo do Jo ão c-comanda a anáfora mas não está co-indexado com ela; e o DP o Jo ão está co-indexado com a anáfora, mas não a c-coman da. É fácil ver que a condição (40) dá conta dos restantes exemplos dis cutidos nesta secção. Quanto aos exemplos da secção anterior, (20a) é tri vialmente permitido pela condição (40). O exemplo (21a), no entanto, é excluído, visto que a anáfora, embora ligada pelo DP a M aria, não se encontra ligada dentro da menor oração que a contém, a oração subordi nada. A distribuição complementar dos pronomes próximos relativamente às anáforas sugere que os pronomes obedecem à seguinte condição: (41)
Um pronome não pode ser ligado dentro da menor oração que o contém.
Um elemento que não é ligado diz-se livre. Damos a seguir a defini ção de «livre relativamente a uma categoria A»: (42)
Uma categoria B é livre de uma categoria A sse (i) A não é co-indexado com B; ou (ii) A não c-comanda B.
Numa configuração sintáctica qualquer, B é livre (em absoluto), se B não estiver ligado por nenhuma categoria. Reformulamos então (41) em (43):
(M) Nesta condição (e nas condições que se seguem), o presente do indicativo no verbo ser deve ser entendido como exprimindo uma modalidade de necessidade (isto é, «deve ser»). Em (40), o inverso de «A liga B» é «B é ligado por A». O termo «preso» é também usado na lógica de predicados (e por alguns linguistas) como sinônimo de «li gado» (e «prender» como sinônimo de «ligar»).
254
(43) Um pronome é livre dentro da menor oração que o contém. Vejamos como esta condição dá conta dos exemplos com pronomes da secção anterior. O exemplo (4b) é permitido visto que não existe nenhum antecedente potencial para o pronome, o qual é portanto trivialmente livre na sua oração. A frase a Maria confia nela é excluída com a representa ção de (20b) (repetida aqui em (44a), mas é aceite com a representação (44b)): (44) a. * [A Maria], confia n[ela\v b [A Maria], confia n[ela]^. Em (44a) (a representação co-referente não gramatical) o pronome é li gado pelo DP a Maria, em violação de (43). Em (44b) (a representa ção de referência disjunta), no entanto, o pronome é livre do DP a M a ria, visto que não é co-indexado com ele (embora seja c-comandado por ele). A frase a M aria pensa que o Luís confia nela é aceite com ambas as representações (21b) (repetidas aqui em (45a) e 45b)): (45) a. [A Maria], pensa que o Luís confia n[ela] ,. b. [A Maria ], pensa que o Luís confia n[ela]r Em (45a) (representando a leitura co-referente) o pronome encontra-se liga do pelo DP a M aria (visto que é co-indexado com ele e c-comandado por ele, como é fácil verificar). No entanto, dentro da menor oração que o contém (a oração subordinada), o pronome é livre, em satisfação da condição (43). Em (45b) (representando a leitura não co-referente), o pronome também é permitido porque não é ligado dentro da me nor oração que o contém (na realidade não é ligado em toda a estrutura, visto que o DP a Maria, embora o c-comande, não possui um índice idêntico). Consideremos agora a seguinte frase: (46) O amigo do João confia nele. As duas representações possíveis de (46), paralelas a (28a,b), são as se guintes: (47)
a. * [O amigo d[o João],]2 confia n[e/e]2. b. [O amigo d[o João],]2 confia n[ele]r
255
Posta vei é • representação (47a) que 6 excluída e a representação (47b) que é aceite. Ou seja. (46) pode significar que o amigo do João confia no Jo io mas n lo pode significar que o indivíduo x que é amigo do Jofio confia nesse mesmo indivíduo x. Vejamos porquê. Em (47a), o pronome é liga do pelo OP o amigo do Jofio dentro da oração menor que o contém, em violação de (43). Em (47b), contudo, o pronome é livre do DP o João, visto que não é c-comandado por ele. O pronome pode pois receber um índice idêntico ao deste DP (o que resulta na leitura co-referente), sem violar a condição (43). Existe uma outra representação possível para (46), correspondente à leitura de referência disjunta (em que ele se refere a uma terceira pessoa que não é nem o João nem o amigo: (48) [O amigo d[o João],]2 confia n[e/e]3. Em (48) o pronome é trivialmente livre, visto que não é co-indexado com nenhum DP da oração. A condição (43) faz a previsão de que trocando as posições entre o pronome e o seu antecedente em (47b) (sem mudar os índices), obtemos uma representação legítima. Por outras palavras, prevê-se que (49a) supor ta uma leitura co-referente, com a representação (49b): (49)
a. O amigo dele confia no João. b. [O amigo d[e/