Ferramentas de auxílio ao tradutor

From TradWiki 2.0
Jump to navigation Jump to search

Ferramentas de tradução são programas de computador desenvolvidos para acelerar o processo de tradução, com diferentes níveis de intervenção humana. São bastante conhecidas pela sigla CAT tools, que pode ser lida como Computer-Assisted ou Computer-Aided Translation tools, em português, tradução assistida ou tradução auxiliada por computador.

Embora a função mais conhecida desse tipo de programa seja o uso das memórias de tradução, esses aplicativos oferecem muitos outros recursos, como gerenciamento de terminologia, controle da qualidade, autocompletamento, além de diversas opções de configuração. Dependendo do texto que se esteja traduzindo, esses outros recursos podem ter até mais relevância do que a memória de tradução.

É comum haver confusão entre ferramentas de auxílio ao tradutor e ferramentas de tradução automática. Porém, enquanto a tradução automática (também chamada de tradução por máquina) consiste em sistemas de tradução com mínima intervenção humana, as ferramentas de auxílio ao tradutor baseiam-se na potencialização da atividade tradutória humana através do uso de recursos automatizados para aumento da produtividade, basicamente com a combinação das TMs (Translation Memories) e com as TBs, Terminology Bases, ou glossários, como são mais usualmente chamadas em português.

O que se observa hoje em dia é uma crescente convergência das tecnologias de tradução humana com sistemas cada vez mais eficientes de tradução por máquina, num processo histórico em que a própria ideia do que seja tradução, e tradutor, está sendo transformada. Para entender melhor essa transformação, comece pela leitura do artigo A virada tecnológica dos Estudos da Tradução, nesta wiki.

Recursos comuns[edit | edit source]

Todas as ferramentas de auxílio ao tradutor baseiam-se em três elementos básicos: conteúdo de partida em formato digital editável, memórias de tradução e glossários.

Conteúdo de partida[edit | edit source]

Comumente chamado de "original", para que um material seja traduzido utilizando-se uma ferramenta de tradução é preciso que esteja num formato editável no computador. Desta forma, não se poderá usar textos de partida impressos em papel ou arquivos PDF não convertidos para um formato editável. Caso o tradutor receba o texto a ser traduzido em formato não editável e queira fazer a tradução usando uma cat tool, terá que converter o material antes de começar. Algumas ferramentas têm recursos para importação de arquivos PDF editáveis, mas nem sempre funcionam a contento. Pode ser interessante investir em ferramentas específicas para esse fim, um bom escâner e um bom programa de OCR – sigla para Optical Character Recognition, ou Reconhecimento Ótico de Caracteres – auxiliam muito o trabalho. Mais detalhes sobre preparação de arquivos PDF para tradução no artigo Tradução de arquivos PDF.

Os arquivos a serem traduzidos podem estar em diferentes formatos. A maioria das cat tools tem recursos de importação de arquivos de apresentações, planilhas, exportados de programas de diagramação, arquivos html, e naturalmente, arquivos de processadores de texto, como os arquivos .doc/.docx do MS Word, ou .rtf, .txt, etc. (etc. não é uma extensão de arquivo ;)).

Memória de tradução[edit | edit source]

As ferramentas baseadas em memória de tradução, em sua maioria, trabalham com qualquer par de idiomas. A ideia geral é de que tudo aquilo que traduzimos vai sendo armazenado, frase a frase, num arquivo ou base de dados (que seria a memória de tradução em si). Toda vez que nos deparamos com uma frase igual ou parecida com alguma que esteja na memória de tradução, o programa nos mostra a tradução anterior para ser reaproveitada no todo ou em parte, ou apenas para servir de referência, a critério do tradutor.

Vejamos esse procedimento com um pouco mais de detalhe. As ferramentas de auxílio ao tradutor dividem automaticamente os arquivos em partes ou segmentos. De forma padronizada, os segmentos são definidos por um ponto seguido de um espaço, dois pontos, uma marca de fim de parágrafo, um signo de pergunta ou exclamação (essas regras de segmentação podem alterar-se de acordo com as necessidades do usuário). Geralmente, os segmentos correspondem a frases ou títulos.

À medida que o tradutor avança na tradução, ele interage basicamente de duas formas com a memória. A primeira é a alimentação. Cada segmento na língua de origem, junto com o correspondente segmento na língua de destino constitui o que se denomina uma unidade de tradução (também conhecida como TU, pela sua sigla em inglês). Essas unidades de tradução vão sendo armazenadas na memória cada vez que o tradutor passa para o próximo segmento. Ou seja, o tradutor vai gerando a memória ao avançar na tradução.

A segunda forma de interação é a recuperação. Cada vez que o tradutor abre ou entra em um segmento durante o processo de tradução, o programa procura na memória um segmento igual ou similar que tenha sido traduzido e armazenado anteriormente. Em caso de que essa procura tenha um resultado positivo, a correspondência entre o segmento que se está traduzindo e o segmento armazenado na memória pode ser total ou parcial. Se a correspondência for total, o programa apresentará a tradução armazenada sugerindo a sua utilização exatamente na forma em que se guardou. Então, podemos dizer que existe 100% de correspondência (ou match) entre o segmento do arquivo que se está traduzindo e aquele guardado na memória. Isso implica duas unidades de tradução exatamente iguais.

Também pode acontecer que a correspondência entre o segmento do arquivo que se está traduzindo e aquele armazenado na memória seja parcial. Nesse caso, o programa avalia essa correspondência em termos percentuais e, por padrão, sugere a utilização da tradução armazenada sempre que esse percentual de similitude seja de 75% ou mais (essa configuração também pode ser alterada pelo usuário). Ao sugerir o uso da unidade de tradução similar armazenada, a ferramenta indica onde está a diferença para que o tradutor possa reaproveitar a frase incorporando as alterações necessárias.

Em qualquer um dos casos anteriores, correspondência total ou parcial, o trabalho do tradutor se reduz, gerando um aumento da produtividade, e também se mantém a consistência na tradução, garantindo que frases iguais sejam traduzidas de forma exatamente igual, seja em um mesmo arquivo, em um conjunto de arquivos que compõem um projeto, ou em diversos arquivos de um mesmo cliente ao longo do tempo.

Embora as memórias de tradução das diversas ferramentas de auxílio ao tradutor possam ter formatos diferentes, uma iniciativa do comitê OSCAR (Open Standards for Container/Content Allowing Re-use) criou um padrão aberto, o TMX (Translation Memory eXchange), que permite o intercâmbio de memórias entre usuários de diferentes ferramentas, facilitando o trabalho colaborativo.

Gerenciamento de terminologia[edit | edit source]

A grande maioria das CAT tools oferece a possibilidade de integrar o uso de bases terminológicas ou glossários (bilíngues ou multilíngues) como parte do fluxo de trabalho de tradução. O objetivo desse recurso é conferir consistência terminológica aos textos individuais e/ou manter a consistência entre textos que fazem parte de um mesmo projeto ou pertencem a um mesmo cliente. Além disso, possibilita um importante aumento de produtividade, já que evita que o tradutor pesquise um termo mais de uma vez, e inclusive permite que as bases terminológicas sejam compartilhadas entre tradutores, clientes e agências.

O uso de bases terminológicas, que podem estar localizadas no computador do tradutor ou em um servidor, se realiza através de duas operações: incorporação e recuperação de termos. A incorporação é efetuada pelo tradutor na medida em que avança no processo de tradução, ao deparar-se com termos que considera importantes ou complexos. Dependendo do programa, é possível introduzir informação adicional que esclareça algum aspecto do termo incorporado ou do contexto. A recuperação se produz quando o termo já incorporado na base terminológica aparece novamente no arquivo que se está traduzindo e o programa o identifica e sugere o uso do termo introduzido anteriormente.

Muitas ferramentas permitem a utilização de bases terminológicas prontas, em formatos como Word, Excel e outros, mediante um simples processo de conversão ao formato de arquivo específico utilizado pelo programa, para permitir a sua incorporação no fluxo de trabalho.

Controle da qualidade[edit | edit source]

A função de controle de qualidade nos softwares de auxílio à tradução analisa a tradução pronta, comparando-a ao original e aos recursos já incluídos no projeto (memórias, glossários) ou outros que podem ser usados somente nesta etapa. É um recurso de extrema utilidade, principalmente em projetos maiores, para uniformizar a terminologia técnica, ajudar na qualidade da formatação e consequentemente facilitar a revisão. Essa análise pode conferir:

- se itens específicos do texto original, como números, tags, sinais de pontuação, estão presentes na tradução. O software deve avisar, por exemplo, se o tradutor tiver trocado a ordem de dois números ou tags ou digitado um número incorretamente. Pode avisar também se os sinais de pontuação estão presentes, se trocas necessárias de um idioma para outro foram feitas (eliminar a interrogação invertida ao traduzir do espanhol, por exemplo), se a pontuação do final da frase ou o uso de maiúsculas e minúsculas não for igual no original e na tradução, ou conforme configurado para o projeto.

- se há segmentos idênticos com traduções diferentes. Isso pode ser uma escolha consciente ou necessária para o contexto, mas também pode ser falta de aplicação do vocabulário correto.

- se há segmentos diferentes com traduções idênticas, o que pode ser sinal de um erro na tradução.

- quando há um termo glossarizado no original, se a tradução do glossário está presente no segmento traduzido.

- se há espaços duplos no meio do segmento ou espaços extras ao final.

- se palavras definidas como "proibidas" em um glossário específico (que pode incluir baixo calão, termos incorretos comuns na área da qual o texto trata, erros de digitação que o tradutor costuma cometer) estão presentes na tradução.

- se os segmentos não excedem os limites de extensão específicos para o projeto (esse tipo de restrição é comum em localização de software ou jogos e em tradução para dublagem ou legendagem). A restrição pode ser definida em termos absolutos (número máximo de palavras ou caracteres) ou relativos (comprimento proporcional ao segmento original).

Autocompletamento[edit | edit source]

Arquivo:AutoSuggest no Wordfast Classic.png
Exemplos do funcionamento do AutoSuggest no Wordfast Classic

Também chamado de autossugestão, é um recurso cada vez mais comum nas CAT tools é o autocompletamento, ou previsão de digitação (predictive typing). O recurso recebe diferentes nomes dependendo da ferramenta, dos quais o mais comum atualmente é "AutoSuggest".

O autocompletamento pode envolver diversos itens, variando conforme o programa e também conforme a configuração feita pelo usuário: nomes próprios, números, termos dos glossários, sequências de palavras que já ocorreram em traduções anteriores, sequências de palavras traduzidas automaticamente. Quando o tradutor começa a digitar um desses elementos (por exemplo, um nome próprio do segmento original ou um termo que conste no glossário), o programa oferece o restante da palavra ou expressão e o tradutor pode completá-las automaticamente com Enter, Tab ou outra tecla ou combinação de teclas.

Pesquisas de concordância[edit | edit source]

A pesquisa de linhas de concordância (Concordance Search) permite buscar uma palavra ou expressão na(s) memória(s) de tradução. Isso permite ao tradutor, mesmo quando não há uma frase inteira que seja suficientemente parecida com o segmento atual para ser apresentada pelo programa como match, consultar todas as ocorrências de certa palavra ou expressão em traduções anteriores e ver as soluções que já utilizou para traduzi-las.

Normalmente o resultado da pesquisa de concordância mostra, além dos segmentos originais e traduzidos, outras informações, como data e horário de criação da entrada na memória, usuário que a criou, etc. Em geral é possível pesquisar por ocorrências tanto em segmentos originais como nos traduzidos.

Em alguns programas a função pode ter nomes diferentes. No Wordfast Pro, por exemplo, chama-se TM Lookup.

Análise[edit | edit source]

A análise é um procedimento que permite obter informação estatística sobre um arquivo ou um conjunto de arquivos a serem traduzidos. Quase todas as ferramentas de auxílio ao tradutor oferecem essa importante função que possibilita ao tradutor calcular o tempo e o esforço que demandará um determinado projeto considerando o número total de palavras, a presença de segmentos repetidos dentro de um arquivo (ou entre arquivos) e a correspondência entre esses segmentos e a memória de tradução utilizada para efetuar a análise. Ao efetuar uma análise, as ferramentas classificam os segmentos (lembrando que o segmento é a unidade que preside a lógica do funcionamento das ferramentas) em uma série de categorias que variam dependendo do programa utilizado. As categorias mais básicas, compartilhadas pela grande maioria dos programas, são: segmentos repetidos, segmentos com algum grau de correspondência com a memória (em termos percentuais) e segmentos novos.

A categoria de segmentos repetidos inclui aqueles segmentos que se repetem dentro de um arquivo ou entre arquivos diferentes analisados juntos. A categoria de segmentos com correspondência, como se explica na seção #Memória de tradução, inclui aqueles que têm algum grau de similitude (indicada em termos percentuais) com os segmentos armazenados na memória de tradução utilizada na análise. A categoria de segmentos novos inclui aqueles segmentos que não são repetidos nem tem nenhuma relação de similitude com os segmentos armazenados na memória.

Arquivo:Log Studio WK.jpg
Exemplo de análise com o SDL Trados Studio

Considerando que muitos tradutores utilizam como medida de produtividade a unidade palavra, que a palavra também é utilizada de forma predominante no mercado da tradução técnica, alvo principal dos desenvolvedores de ferramentas, e que outros tradutores, como os juramentados e literários, utilizam como unidade de medida a lauda, composta por um número determinado de caracteres, as ferramentas também oferecem a informação resultante da análise em palavras e caracteres. Mas é importante salientar que essa informação é simplesmente uma forma diferente de apresentar os dados de classificação dos segmentos: as palavras e caracteres sempre correspondem ao conteúdo dos segmentos e nunca a palavras ou caracteres soltos.

Uma vez efetuada a análise, o tradutor poderá ter uma ideia mais precisa do trabalho que exigirá um projeto e também poderá efetuar análises sucessivas ao longo do trabalho para verificar o progresso. Para as agências de tradução, esse cálculo também será a base para determinar o pagamento aos tradutores. Uma prática comum entre as agências é a definição de uma tabela com valores diferenciados para palavras novas, repetições e os diferentes percentuais de correspondência, utilizando as categorias analíticas das ferramentas.

Outros recursos[edit | edit source]

Além das funções acima, a utilização de ferramentas de auxílio ao tradutor traz ainda outras vantagens, como:

  • Como o texto é segmentado (aproximadamente) frase a frase, o tradutor não corre o risco de saltar trechos do texto;
  • O tradutor trabalha sempre visualizando o trecho original e sua tradução juntos na tela, o que é benéfico inclusive em termos de ergonomia;
  • A formatação do texto original é reproduzida no texto traduzido.
  • Algumas ferramentas oferecem a possibilidade de trabalhar com uma grande variedade de formatos de arquivo (além da suite do Office), como html, xml, inx, idml e mif, entre muitos outros. Isso permite traduzir arquivos gerados por programas específicos como, por exemplo, Indesign e FrameMaker, sem necessidade de ter esses programas instalados.

Exemplos de ferramentas de auxílio ao tradutor[edit | edit source]

  • Wordfast Anywhere (online, uso gratuito)


Para uma comparação entre diferentes CAT tools alimentada pelos próprios usuários, pode-se utilizar a ferramenta de comparação do ProZ.com.

Tópicos relacionados[edit | edit source]