Chamamos de transcrição ao conjunto coeso e abrangente de regras de escrita que viabiliza a representação gráfica do discurso oral de pelo menos um idioma.
Transcrições ortográficas
Muitas transcrições foram criadas pelos povos ao longo da História, quase sempre voltadas para as necessidades de uma língua específica, tanto que é difícil dissociar, por exemplo, a escrita árabe da língua árabe ou a escrita chinesa do idioma chinês.
A transcrição romana, associada ao latim, originou várias transcrições contemporâneas distintas, de modo que as regras de escrita do inglês diferem bastante das usadas em português, embora ambos os idiomas tenham adotado como ponto de partida as regras da escrita romana.
Em princípio, um sistema de escrita não se vincula necessariamente a um idioma, ou mesmo a um país que adota determinado idioma, mas na prática, é difícil escrever um discurso criado em um idioma, usando as regras ortográficas de outro. Vamos exemplificar:
- I love you.
O texto acima foi escrito segundo as regras ortográficas do inglês e corresponde à frase:
- /áy-lóv-yu/
Se o texto fosse lido seguindo as regras ortográficas do português o resultado seria:
- /i-‘ló-ve-yôw/
Embora ingleses e brasileiros usem um conjunto semelhante de grafemas, o valor fonológico que cada grafema assume nas duas ortografias difere sensivelmente. Exemplo é o grafema i que na ortografia inglesa pode funcionar como dífono e representar /áy/. Na ortografia brasileira, i nunca funciona como dífono e representa preferencialmente a vogal /i/.
Chamamos de transcrição ortográfica, ou simplesmente ortografia, a transcrição ligada a um idioma específico que é oficial para a representação escrita desse idioma. Temos que levar em conta alguns casos especiais nessa definição. Há países que adotam um idioma comum, mas possuem transcrições ortográficas distintas. É o que ainda acontece, por exemplo, nos países de língua portuguesa. Também ocorre de um mesmo país apresentar vários dialetos, mas uma só ortografia.
Transcrições biunívocas
As transcrições ortográficas em uso na atualidade são resultado de uma evolução histórica da qual participaram inúmeros agentes. São obra coletiva, resultado de muitas intervenções com índoles variadas ao longo dos anos. Os linguistas encontram dificuldades para usar transcrições ortográficas nas descrições científicas da língua.
São dificuldades variadas e podemos citar só como exemplo algumas que ocorrem nos sistemas fonológicos de escrita como: ausência de biunivocidade entre grafema e fonema; presença de dígrafos, dífonos e grafemas mudos; regras pouco racionais e cheias de exceções, etc. Essas dificuldades não são intransponíveis, mas levam a uma considerável perda de produtividade durante os estudos e, por isso, surgiram propostas de transcrições biunívocas.
No estágio atual de evolução da escrita, as transcrições biunívocas circulam apenas nos ambientes de estudo da língua como é o caso deste nosso trabalho. Uma transcrição biunívoca é aquela que, grosso modo, poderia ser entendida pelo senso comum como uma escrita em que se escreve como se lê.
Escreve-se como se lê
O sonho de escrever como se lê é antigo e, provavelmente, já foi acalentado por todos que algum dia se digladiaram com o emaranhado de regras confusas das transcrições ortográficas. No entanto, não é questão pacífica a definição dos parâmetros que caracterizariam uma transcrição biunívoca ideal. Não há acordo sobre que níveis de correspondência entre discurso escrito e falado seriam suficientes para caracterizar uma transcrição biunívoca. Só para mostrar a dimensão da polêmica, vamos apresentar alguns questionamentos que envolvem transcrições biunívocas:
- A transcrição será otimizada para um idioma específico ou pensada para atender a vários idiomas?
- Transcrições biunívocas devem ser pensadas para substituir as ortografias tradicionais no futuro?
- Faz sentido segmentar os enunciados palavra a palavra, já que no discurso falado isso não acontece e, muitas vezes, a adjacência dos segmentos produz sínteses não previstas pela escrita segmentada?
- Deve-se marcar a separação silábica na escrita?
- Acentos de intensidade, tom e duração devem ser marcados na escrita?
- Faz sentido distinguir variantes de fonemas se isso não for relevante à compreensão da mensagem?
- Variantes de pronúncia devem ser registradas ou substituídas pela pronúncia padrão?
- Como representar fonemas que não existem na língua quando da citação de estrangeirismos?
Os lingüistas têm dado respostas variadas a essas perguntas. Em função disso, têm surgido várias propostas de transcrição biunívoca, mas interessa-nos aglutiná-las em dois polos. De um lado, as transcrições biunívocas focadas em um idioma específico e, de outro, as universais, que tentam dar conta de todo e qualquer idioma.
A transcrição da IPA
A IPA (International Phonetic Association) desenvolveu uma transcrição biunívoca universal que vem sendo aperfeiçoada continuamente. Dessa transcrição faz parte o AFI (Alfabeto Fonético Internacional), ou IPA (International Phonetic Alphabet), cuja última atualização data de 1996. Pode-se dizer que a transcrição da API é o padrão para estudos linguísticos em que se quer uma transcrição rigorosa e independente de idioma.
O rigor da transcrição da IPA, em certos casos, pode ser uma desvantagem. No estudo de um idioma específico, por exemplo, uma transcrição voltada para as especificidades desse idioma pode resultar mais prática e enxuta, pois desconsidera itens ausentes no idioma. Por outro lado, quando se faz estudos envolvendo vários idiomas, as vantagens da transcrição da API são visíveis, já que ela considera todos os fonemas presentes em idiomas conhecidos e possui notações para tom, intensidade, duração e demais categorias fonológicas.
Transcrições biunívocas orientadas por idioma
Cada idioma apresenta um conjunto característico de fonemas. Os falantes tendem a se restringir a esse conjunto, que lhes parece natural, pois estão habituados com ele e quando incorporam estrangeirismos, muitas vezes modificam a pronúncia do novo termo visando eliminar fonemas não pertencentes ao conjunto básico do idioma.
O conjunto básico de fonemas de uma língua costuma oscilar em torno de trinta a quarenta itens. Em português, usamos 34 fonemas. O AFI (Alfabeto Fonético Internacional), por outro lado, considera um número muito maior de fonemas, pois se trata de uma transcrição universal. Quando adotamos o AFI na representação da nossa língua estamos lançando mão de uma quantidade de grafemas e convenções muito maior do que a necessária para a representação correta dos discursos em português. A opção por uma transcrição biunívoca universal pode, em certos casos, resultar em exagero de rigor. Nessas horas é que uma transcrição biunívoca focada no idioma pode resultar mais prática e usável.
Em nosso trabalho, sempre que quisermos rigor fonológico na escrita, adotaremos uma transcrição biunívoca orientada para o português brasileiro. Trata-se de uma solução de equilíbrio, que contempla de um lado o contato dos falantes brasileiros com nossa ortografia e, de outro, considera as soluções da transcrição universal da API. A transcrição que adotamos resulta de uma condensação de soluções presentes na bibliografia especializada.
Não temos ainda uma transcrição biunívoca para o português brasileiro que possa ser considerada padrão. Aliás, ainda estamos bem longe disso, mas é provável que com o tempo cheguemos a uma padronização nessa área.
Ortografias latinas (romanas)
Embora a língua não se prenda a um sistema de escrita específico, historicamente, a ortografia da língua portuguesa é ligada à escrita desenvolvida na Roma Antiga. A transcrição criada em Roma deu origem a inúmeras transcrições ortográficas contemporâneas de vasto emprego na atualidade, entre elas, a brasileira.
As transcrições romanas são bastante econômicas em vários aspectos, pois usam um número reduzido de grafemas, têm regras simples que facilitam seu aprendizado, são de boa legibilidade e oferecem facilidades para serem tratadas nos meios de produção gráfica. Provavelmente, essas qualidades contribuíram para a ampla disseminação das transcrições romanas, mas logicamente não é só a qualidade que determina a aceitação de um sistema de escrita.
Outros fatores históricos e sociais devem ser considerados no processo. O fato é que as transcrições romanas são de vasto emprego na atualidade, tanto que podemos chamar o grupo por elas formado de escrita ocidental.
Convenções gerais
Vamos citar algumas convenções básicas das transcrições romanas.
- Escreve-se em linhas horizontais da esquerda para direita.
- A sequência de leitura das linhas é de cima para baixo.
- As páginas são viradas em sentido anti-horário.
- Os enunciados são separados palavra a palavra por meio do espaço em branco.
- O conjunto de grafemas apresenta quatro variações principais: maiúsculas tipográficas, maiúsculas cursivas, minúsculas tipográficas e minúsculas cursivas, usadas cada uma em contextos específicos.
As regras acima podem parecer muito óbvias para quem está acostumado com a escrita ocidental, mas é bom lembrar que existem exemplos em outros sistemas de escrita em que se procede de maneira diversa. Na escrita hieroglífica, os grafemas eram distribuídos para uma ocupação otimizada da área de escrita e, por isso, não era perfeitamente linear. Na escrita hebraica, se escreve da direita para a esquerda.
Na escrita chinesa, se escreve em linhas verticais. Em árabe, as páginas são giradas em sentido horário. A escrita hieroglífica era extremamente versátil, tanto que nela era possível escrever na vertical ou na horizontal, para direita ou para esquerda, à vontade do escriba. Alguns sistemas antigos de escrita não faziam segmentação do texto em palavras.
Outras convenções poderiam ser citadas, mas, por hora, é suficiente, afinal, não existe um conjunto de regras a que se possa chamar de transcrição romana. Existem sim, vários conjuntos de regras, que se assemelham entre si e que podem ser considerados como variantes de um conjunto mais amplo e abstrato. Em cada idioma que adota a linha romana existem regras ortográficas específicas. Em espanhol, as frases interrogativas começam com o sinal ¿.
Em português, usamos diacríticos como o acento agudo e o til. Em alemão, até recentemente empregava-se o grafema ß. Os sistemas de escrita que chamamos de romanos apresentam várias semelhanças em alguns aspectos, mas também diferenças acentuadas em outros. Por isso, temos que considerar a escrita romana como uma abstração, como uma família de sistemas de escrita assemelhados que assumem contornos particulares para atender as necessidades de idiomas específicos.
Transcrição biunívoca brasileira
Ainda não temos uma TBB (transcrição biunívoca brasileira) aceita como padrão para os estudos linguísticos do nosso idioma. De um lado, temos a ortografia brasileira e, do outro, a transcrição da IPA (International Phonetic Association). Falta-nos a solução intermediária, específica para o português brasileiro. Por isso, lançamos esta proposta de transcrição biunívoca brasileira que busca uma solução de equilíbrio entre os dois extremos.
Convenções gerais
Vamos relacionar as convenções básicas da transcrição proposta.
Sentido de leitura. A transcrição aqui apresentada adotará as convenções das transcrições romanas, tais como: leitura da esquerda para a direita em linhas horizontais percorridas de cima para baixo e com as páginas sendo giradas em sentido anti-horário.
Barras. Quando usarmos a TBB mesclada com a ortografia brasileira, delimitaremos a TBB por barras. Veja o exemplo:
- Exceção equivale na TBB a /êsêsãw/.
Espaço em branco. A pausa será representada pelo espaço em branco. A colocação de espaços em branco palavra a palavra é opcional. Cabe ao redator decidir se usará o espaço em branco a cada palavra como ocorre na ortografia tradicional, ou se usa o espaço em branco apenas na representação de pausas de valor sintático. A opção escolhida repercute sensivelmente na transcrição, pois eliminando a segmentação palavra a palavra devemos considerar as interações fonológicas que ocorrem nas adjacências das palavras. Veja um exemplo:
- /áws sábádôs sêâmôs ás sétê/
- /áwsábádôsêâmôsáséte/
Repare que quando o mesmo fonema ocorre no final da palavra anterior e no início da próxima, tendemos a pronunciá-lo apenas uma vez.
Hífen. Nesta transcrição, a função do hífen é indicar a separação silábica. Seu uso é opcional. Cabe ao redator decidir se indicará a separação silábica no texto. São válidos:
- /átẽsyózámẽtê/
- /á-tẽ-syó-zá-mẽ-tê/
Apóstrofo. A função do apóstrofo nesta transcrição é indicar as sílabas intensas. O apóstrofo antecede a sílaba intensa e seu uso é opcional. São válidos:
- /rêpúblicá fêdêrátivá dô brásiw/
- /rê’públicá fêdêrá’tivá dô brá’siw/
Maiúsculas. Nesta transcrição, não se usa grafemas maiúsculos, exceção feita ao grafema R, que não representa o mesmo fonema que o grafema r.
Pontuação. Não se usa sinais de pontuação nesta transcrição, exceto o sinal de interrogação, que indica a entoação típica das frases interrogativas. O sinal de interrogação será colocado no final da frase. A marcação de final de período, a delimitação de itens de enumerações e demais funções tipicamente associadas aos sinais de pontuação da ortografia brasileira, serão indicadas pelo uso do espaço em branco, que tem valor de pausa.
Variante culta. Esta transcrição não se prende ao padrão culto do idioma. Como é uma transcrição biunívoca, pode ser empregada para a representação de outras variantes da nossa língua. Cabe ao redator definir se reproduzirá a pronúncia da variante culta ou se indicará pronuncias coloquiais, elípticas, regionais, etc.
Grafemas fonológicos
Os 35 grafemas propostos para a transcrição estão na tabela a seguir. São 13 para representar vogais, 2 para semivogais e 20 para consoantes.
Grafema | Fonema representado | Exemplos em ortografia brasileira |
á | /á/ | Água |
â | /â/ | Âmago |
ã | /ã/ | Âmbar |
é | /é/ | Égua |
ê | /ê/ | Estado |
ẽ | /ẽ/ | Êmbolo |
i | /i/ | Idiota |
ĩ | /ĩ/ | Índio |
ó | /ó/ | Óbvio |
ô | /ô/ | Ovo |
õ | /õ/ | Onda |
u | /u/ | Urubu |
ũ | /ũ/ | Umbigo |
y | /y/ | Boi |
w | /w/ | Mau |
b | /b/ | Bato |
d | /d/ | Dado |
f | /f/ | Faca |
g | /g/ | Garra |
h | /h/ | Hardware |
j | /j/ | Jarro |
k | /k/ | Casa |
l | /l/ | Lata |
m | /m/ | Macaco |
n | /n/ | Noite |
p | /p/ | Poço |
r | /r/ | Araponga |
R | /R/ | Raspa |
s | /s/ | Sebo |
t | /t/ | Teto |
v | /v/ | Vício |
x | /x/ | Xarope |
z | /z/ | Zoeira |
ñ | /ñ/ | Estranho |
λ | /λ/ | Telha |
Ortografia brasileira oficial
Ortografia brasileira é o conjunto de regras oficiais que determina nossa escrita. Nossa ortografia tem um vínculo histórico e social profundo com a variante culta do idioma. Tradicionalmente, as regras ortográficas consideram apenas a variante culta e podemos dizer que não existe nenhuma ortografia oficial para as demais variantes da nossa língua.
No Brasil, as regras ortográficas oficiais têm sido definidas pela ABL (Academia Brasileira de Letras). Os principais documentos que regem nossa ortografia são:
- Vocabulário Ortográfico da Língua Portuguesa. Esta obra, organizada pela ABL, determina atualmente a grafia de mais de 360.000 registros lexicais. Sua versão on-line pode ser consultada no site da ABL (www.academia.org.br).
- Formulário Ortográfico. Aprovado pela Academia Brasileira de Letras em 13 de agosto de 1943, estabelece as diretrizes para a elaboração do Vocabulário Ortográfico da Língua Portuguesa.
- Lei Federal nº 5765 de 18 de dezembro de 1971. Introduziu algumas alterações nas regras ortográficas, ligadas especialmente ao uso de diacríticos.
- Decreto Legislativo do Senado Federal nº 54 de 18 de abril de 1995. Aprova o Acordo Ortográfico da Língua Portuguesa de 1990. Esse acordo tem por objetivo criar uma ortografia unificada para todos os países lusófonos, ou seja, que adotam o português como língua oficial: Angola, Brasil, Cabo Verde, Guiné-Bissau, Moçambique, Portugal e São Tomé e Príncipe. Em função de atrasos na sua implantação, teremos ainda um período de transição até que as mudanças trazidas pelo acordo sejam uma realidade. Em função disso, nosso trabalho não considera as mudanças previstas no acordo.
A documentação brasileira oficial sobre ortografia não é descritiva, nem rigorosa e, muito menos, abrangente. Sua característica principal é a preocupação de ressaltar as diferenças entre os estágios anterior e posterior à sua implantação. O Formulário Ortográfico, por exemplo, ocupa-se em boa parte de seu texto de explicitar as mudanças implantadas a partir de 1943.
As lacunas deixadas pela documentação ortográfica oficial são preenchidas por outros agentes da língua. Nessa tarefa, atuam gramáticos, lexicógrafos, editores e estudiosos variados. Mais recentemente, ganharam importância os manuais de estilo das grandes editoras e dos jornais de grande circulação, que servem como referência em questões ortográficas, principalmente nas formações recentes.
Grafologia
- A escrita
- Transcrições e ortografias
- Alfabeto romano (latino)
- Grafema
- Grafemas da ortografia brasileira
- Diacríticos da ortografia brasileira
- Acentos agudo e circunflexo
- Crase
- Dígrafos da ortografia brasileira
- Representação de fonemas brasileiros
- Representação ortográfica múltipla
- Representação da escrita em computador
- Iniciais maiúsculas