Inovação, Segurança

Como a IA e a Wikipédia levaram línguas vulneráveis ​​a uma espiral de destruição



Quando Kenneth Wehr começou a gerenciar a versão em groenlandês da Wikipédia, há quatro anos, seu primeiro ato foi apagar quase tudo. Era preciso eliminar tudo, pensou ele, para que a Wikipédia tivesse alguma chance de sobreviver.

Wehr, de 26 anos, não é da Groenlândia — ele cresceu na Alemanha —, mas ficou obcecado pela ilha, um território autônomo dinamarquês, depois de visitá-la na adolescência. Ele passou anos escrevendo artigos obscuros na Wikipédia em sua língua nativa sobre praticamente tudo relacionado à ilha. Ele chegou a se mudar para Copenhague para estudar groenlandês, um idioma falado por cerca de 57.000 pessoas, em sua maioria indígenas inuítes, espalhadas por dezenas de aldeias remotas no Ártico.

A edição em groenlandês foi adicionada à Wikipédia por volta de 2003, poucos anos após o lançamento da versão em inglês. Quando Wehr assumiu a direção, quase 20 anos depois, centenas de wikipedistas já haviam contribuído e escrito coletivamente cerca de 1.500 artigos, totalizando dezenas de milhares de palavras. Parecia uma demonstração impressionante da eficácia da abordagem colaborativa que tornou a Wikipédia a principal fonte de informação online, comprovando que ela poderia funcionar até mesmo nos lugares mais improváveis.

Havia apenas um problema: a Wikipédia da Groenlândia era uma miragem.

Praticamente todos os artigos haviam sido publicados por pessoas que não falavam o idioma. Wehr, que agora leciona groenlandês na Dinamarca, especula que talvez apenas um ou dois groenlandeses tenham contribuído. Mas o que mais o preocupava era outra coisa: com o tempo, ele percebeu que um número crescente de artigos parecia ter sido copiado e colado na Wikipédia por pessoas que usavam tradutores automáticos. Eles estavam repletos de erros elementares — de gafes gramaticais a palavras sem sentido, até imprecisões mais significativas, como uma entrada que afirmava que o Canadá tinha apenas 41 habitantes. Outras páginas continham, às vezes, sequências aleatórias de letras geradas por máquinas que não conseguiam encontrar palavras adequadas em groenlandês para se expressarem.

“Pode ter parecido algo da Groenlândia para [os autores], mas eles não tinham como saber”, reclama Wehr.

“As frases não fariam sentido nenhum, ou teriam erros óbvios”, acrescenta. “Os tradutores de IA são muito ruins em groenlandês.”

O que Wehr descreve não é exclusivo da edição da Groenlândia.

A Wikipédia é o projeto multilíngue mais ambicioso depois da Bíblia: existem edições em mais de 340 idiomas, e outros 400, ainda mais obscuros, estão sendo desenvolvidos e testados. Muitas dessas edições menores foram inundadas com conteúdo traduzido automaticamente, à medida que a inteligência artificial se tornou cada vez mais acessível. Voluntários que trabalham em quatro idiomas africanos, por exemplo, estimaram à MIT Technology Review que entre 40% e 60% dos artigos em suas respectivas edições da Wikipédia eram traduções automáticas não corrigidas. E, após auditar a edição da Wikipédia em inuktitut, um idioma indígena próximo ao groenlandês falado no Canadá, a MIT Technology Review estima que mais de dois terços das páginas com mais de algumas frases apresentam trechos criados dessa forma.

Isso está começando a causar um problema grave . Sistemas de IA, do Google Tradutor ao ChatGPT, aprendem a “falar” novos idiomas coletando enormes quantidades de texto da internet. A Wikipédia é, por vezes, a maior fonte de dados linguísticos online para idiomas com poucos falantes — portanto, quaisquer erros nessas páginas, gramaticais ou de qualquer outra natureza, podem contaminar as fontes de onde a IA deve extrair informações. Isso pode tornar a tradução desses idiomas pelos modelos particularmente propensa a erros, o que cria uma espécie de ciclo vicioso linguístico, à medida que as pessoas continuam adicionando cada vez mais páginas da Wikipédia mal traduzidas usando essas ferramentas, e os modelos de IA continuam sendo treinados com páginas mal traduzidas. É um problema complexo, mas se resume a um conceito simples: lixo entra, lixo sai .

“Esses modelos são construídos com base em dados brutos”, diz Kevin Scannell, ex-professor de ciência da computação da Universidade de Saint Louis, que agora desenvolve softwares específicos para línguas ameaçadas de extinção. “Eles tentam aprender tudo sobre uma língua do zero. Não há nenhuma outra entrada. Não há livros de gramática. Não há dicionários. Não há nada além do texto inserido.”

Não existem dados perfeitos sobre a dimensão deste problema, principalmente porque muitos dados de treinamento de IA são mantidos em sigilo e a área continua a evoluir rapidamente. Mas, em 2020, estimava-se que a Wikipédia constituía mais da metade dos dados de treinamento utilizados em modelos de IA para traduzir alguns idiomas falados por milhões de pessoas na África, incluindo malgaxe, iorubá e shona. Em 2022, uma equipe de pesquisa alemã que investigou quais dados poderiam ser obtidos por meio de raspagem online descobriu que a Wikipédia era a única fonte de dados linguísticos online de fácil acesso para 27 idiomas com poucos recursos.

Isso pode ter repercussões significativas em casos onde a Wikipédia é mal escrita — potencialmente empurrando os idiomas mais vulneráveis ​​da Terra para o abismo, à medida que as gerações futuras começam a se afastar deles.

“A Wikipédia será refletida nos modelos de IA para esses idiomas”, afirma Trond Trosterud, linguista computacional da Universidade de Tromsø, na Noruega, que há anos vem alertando sobre os potenciais danos causados ​​por edições mal administradas da Wikipédia. “Acho difícil imaginar que isso não terá consequências. E, claro, quanto mais dominante a posição da Wikipédia, pior será.”

Use com responsabilidade.
A automação está integrada à Wikipédia desde os seus primórdios. Bots mantêm a plataforma operacional: eles reparam links quebrados, corrigem formatação incorreta e até mesmo erros ortográficos. Essas tarefas repetitivas e rotineiras podem ser automatizadas com relativa facilidade. Existe até mesmo um exército de bots que se movimentam constantemente, gerando artigos curtos sobre rios, cidades ou animais, simplesmente inserindo seus nomes em frases padronizadas. De modo geral, eles têm contribuído para o aprimoramento da plataforma.

Mas a IA é diferente. Qualquer pessoa pode usá-la para causar danos massivos com apenas alguns cliques.

A Wikipédia lidou com o início da era da IA ​​melhor do que muitos outros sites. Não foi inundada por bots de IA ou desinformação, como aconteceu com as redes sociais. Em grande parte, preserva a inocência que caracterizou os primórdios da internet. A Wikipédia é aberta e gratuita para qualquer pessoa usar, editar e extrair conteúdo, e é administrada pela própria comunidade que serve. É transparente e fácil de usar. Mas plataformas administradas pela comunidade dependem do tamanho de suas comunidades para sobreviver. O inglês triunfou, enquanto o groenlandês afundou.

“Precisamos de bons wikipedistas. Isso é algo que as pessoas consideram garantido. Não é mágica”, diz Amir Aharoni, membro voluntário do Comitê de Língua, que supervisiona as solicitações para abrir ou fechar edições da Wikipédia. “Se você usar a tradução automática de forma responsável, ela pode ser eficiente e útil. Infelizmente, não podemos confiar que todas as pessoas a usem de forma responsável.”

Trosterud estudou o comportamento de usuários em pequenas edições da Wikipédia e afirma que a IA empoderou um subconjunto que ele chama de “sequestradores da Wikipédia”. Esses usuários podem variar bastante — desde adolescentes ingênuos criando páginas sobre suas cidades natais ou seus YouTubers favoritos até wikipedistas bem-intencionados que pensam que, ao criar artigos em línguas minoritárias, estão de alguma forma “ajudando” essas comunidades.

“O problema deles hoje em dia é que estão armados com o Google Tradutor”, diz Trosterud, acrescentando que isso lhes permite produzir conteúdo muito mais longo e com aparência mais plausível do que antes: “Antes, eles estavam armados apenas com dicionários”.

Isso efetivamente industrializou os atos de destruição — que afetam principalmente as línguas vulneráveis, já que as traduções automáticas costumam ser muito menos confiáveis ​​para elas. Pode haver muitas razões diferentes para isso, mas uma parte significativa do problema é a quantidade relativamente pequena de textos originais disponíveis online. E, às vezes, os modelos têm dificuldade em identificar um idioma porque ele é semelhante a outros, ou porque alguns, incluindo o groenlandês e a maioria das línguas indígenas americanas, têm estruturas que os tornam pouco adequados ao funcionamento da maioria dos sistemas de tradução automática. (Wehr observa que, em groenlandês, a maioria das palavras é aglutinativa, ou seja, é formada pela adição de prefixos e sufixos a radicais. Como resultado, muitas palavras são extremamente específicas ao contexto e podem expressar ideias que, em outros idiomas, exigiriam uma frase completa.)

Uma pesquisa realizada pelo Google antes de uma grande expansão do Google Tradutor, lançada há três anos, constatou que os sistemas de tradução para idiomas com menos recursos eram, em geral, de qualidade inferior aos sistemas para idiomas com mais recursos. Os pesquisadores descobriram, por exemplo, que seu modelo frequentemente traduzia incorretamente substantivos básicos entre idiomas, incluindo nomes de animais e cores. (Em uma declaração à MIT Technology Review , o Google afirmou estar “comprometido em atender a um alto padrão de qualidade para todos os 249 idiomas” que oferece suporte, “testando e aprimorando rigorosamente seus sistemas, principalmente para idiomas que podem ter recursos textuais públicos limitados na web”.)

A própria Wikipédia oferece uma ferramenta de edição integrada chamada Content Translate, que permite aos usuários traduzir artigos automaticamente de um idioma para outro — a ideia é economizar tempo, preservando as referências e a formatação complexa dos originais. Mas ela depende de sistemas externos de tradução automática, então sofre dos mesmos problemas que outros tradutores automáticos — um problema que a Fundação Wikimedia afirma ser difícil de resolver. Cabe à comunidade de cada edição decidir se essa ferramenta é permitida, e algumas optaram por não adotá-la. (Vale ressaltar que a Wikipédia em inglês praticamente proibiu seu uso, alegando que cerca de 95% dos artigos criados com o Content Translate não atendiam a um padrão aceitável sem um trabalho adicional significativo.) Mas pelo menos é fácil saber quando o programa foi usado; o Content Translate adiciona uma etiqueta no sistema da Wikipédia.

Outros programas de IA podem ser mais difíceis de monitorar. Ainda assim, muitos editores da Wikipédia com quem conversei disseram que, depois que seus idiomas foram adicionados às principais ferramentas de tradução online, notaram um aumento correspondente na frequência com que páginas mal traduzidas, provavelmente por máquinas, eram criadas.

Alguns wikipedistas que usam IA para traduzir conteúdo ocasionalmente admitem que não falam os idiomas de destino. Eles podem se ver como fornecedores de artigos em versão preliminar para comunidades menores, que podem então ser revisados ​​pelos falantes nativos — essencialmente seguindo o mesmo modelo que funcionou bem para edições mais ativas da Wikipédia.

O Google Tradutor, por exemplo, diz que a palavra em fulfulde para janeiro significa junho, enquanto o ChatGPT diz que é agosto ou setembro. Os programas também sugerem que a palavra em fulfulde para “colheita” significa “febre” ou “bem-estar”, entre outras possibilidades.
Mas, uma vez produzidas páginas repletas de erros em línguas minoritárias, geralmente não há um exército de pessoas com conhecimento dessas línguas prontas para corrigi-las. Há poucos leitores dessas edições e, às vezes, nenhum editor fixo.

Yuet Man Lee, um professor canadense na casa dos 20 anos, conta que usou uma combinação do Google Tradutor e do ChatGPT para traduzir alguns artigos que havia escrito para a Wikipédia em inglês para o inuktitut, pensando que seria uma boa ideia contribuir e ajudar uma comunidade menor da Wikipédia. Ele diz que adicionou uma nota a um dos artigos explicando que era apenas uma tradução aproximada. “Não achei que alguém fosse notar [o artigo]”, explica. “Se você publica algo nas Wikipédias menores, na maioria das vezes ninguém vê.”

Mas, ao mesmo tempo, ele diz que ainda pensava que “alguém poderia ver e corrigir” — acrescentando que se perguntou se a tradução para o inuktitut gerada pelos sistemas de IA estava gramaticalmente correta. Ninguém mexeu no artigo desde que ele o criou.

Lee, professor de ciências sociais em Vancouver e que começou a editar verbetes na Wikipédia em inglês há uma década, afirma que usuários familiarizados com Wikipédias mais ativas podem ser vítimas dessa mentalidade, que ele chama de “arrogância da Wikipédia maior”: ao tentarem contribuir para edições menores da Wikipédia, presumem que outros virão corrigir seus erros. Às vezes, isso pode funcionar. Lee conta que já havia contribuído com vários artigos para a Wikipédia em tártaro, um idioma falado por milhões de pessoas, principalmente na Rússia, e pelo menos um deles foi corrigido. Mas a Wikipédia em inuktitut é, em comparação, um “deserto”.

Ele enfatiza que suas intenções eram boas: queria adicionar mais artigos a uma Wikipédia indígena canadense. “Agora estou pensando que talvez tenha sido uma má ideia. Não considerei que poderia estar contribuindo para um ciclo vicioso”, diz ele. “Tratava-se de tentar publicar conteúdo, por curiosidade e diversão, sem pensar devidamente nas consequências.”

“Totalmente, completamente sem futuro”
A Wikipédia é um projeto movido por um otimismo ingênuo. Editar pode ser uma tarefa ingrata, envolvendo semanas de discussões com pessoas anônimas e sem rosto, mas os dedicados investem horas de trabalho não remunerado por um compromisso com uma causa maior. É esse compromisso que motiva muitos dos editores regulares de línguas minoritárias com quem conversei. Todos eles temiam o que aconteceria se conteúdos irrelevantes continuassem a aparecer em suas páginas.

Abdulkadir Abdulkadir, um planejador agrícola de 26 anos que conversou comigo por telefone, com a voz chiada, de uma estrada movimentada no norte da Nigéria, disse que passa três horas por dia digitando informações em fulfulde, sua língua nativa, usada principalmente por pastores e agricultores do Sahel. “Mas o trabalho é demais”, disse ele.

Abdulkadir vê uma necessidade urgente de que a Wikipédia em fulfulde funcione corretamente. Ele a tem sugerido como um dos poucos recursos online para agricultores em aldeias remotas, oferecendo potencialmente informações sobre quais sementes ou culturas seriam mais adequadas para seus campos, em um idioma que eles possam entender. Se você lhes der um artigo traduzido automaticamente, Abdulkadir me disse, isso poderá “facilmente prejudicá-los”, já que a informação provavelmente não será traduzida corretamente para o fulfulde.

O Google Tradutor, por exemplo, diz que a palavra em fulfulde para janeiro significa junho, enquanto o ChatGPT diz que é agosto ou setembro. Os programas também sugerem que a palavra em fulfulde para “colheita” significa “febre” ou “bem-estar”, entre outras possibilidades.

Abdulkadir disse que recentemente foi obrigado a corrigir um artigo sobre feijão-fradinho, uma cultura comercial fundamental em grande parte da África, depois de descobrir que o texto era praticamente ilegível.

Se alguém quiser criar páginas na Wikipédia em fulfulde, Abdulkadir disse que elas devem ser traduzidas manualmente. Caso contrário, “quem ler seus artigos não conseguirá adquirir nem mesmo o conhecimento básico”, alerta ele aos wikipedistas. Mesmo assim, ele estima que cerca de 60% dos artigos ainda sejam traduções automáticas não corrigidas. Abdulkadir me disse que, a menos que algo importante mude na forma como os sistemas de IA aprendem e são implementados, o futuro do fulfulde é sombrio. “Vai ser terrível, sinceramente”, disse ele. “Totalmente, completamente sem futuro.”

Do outro lado do país, longe de Abdulkadir, Lucy Iwuala contribui para a Wikipédia em igbo, um idioma falado por milhões de pessoas no sudeste da Nigéria. “O estrago já está feito”, disse-me ela, abrindo os dois artigos mais recentes. Ambos haviam sido traduzidos automaticamente pela ferramenta de tradução automática da Wikipédia e continham tantos erros que, segundo ela, continuar a leitura lhe daria dor de cabeça. “Há alguns termos que nem sequer foram traduzidos. Ainda estão em inglês”, apontou. Ela reconheceu o nome de usuário que criou as páginas como um infrator contumaz. “Este inclui até letras que não existem no idioma igbo”, disse ela.

Iwuala começou a contribuir regularmente para a Wikipédia há três anos, preocupada com o fato de o igbo estar sendo substituído pelo inglês. Essa é uma preocupação comum a muitos que participam ativamente de edições menores da Wikipédia. “Esta é a minha cultura. É quem eu sou”, disse-me ela. “Essa é a essência de tudo: garantir que você não seja apagado.”

Iwuala, que agora trabalha como tradutora profissional entre inglês e igbo, disse que os usuários que causam mais danos são inexperientes e veem as traduções por IA como uma forma de aumentar rapidamente a visibilidade da Wikipédia em igbo. Ela frequentemente se vê obrigada a explicar em maratonas de edição online que organiza, ou por e-mail para diversos editores propensos a erros, que os resultados podem ser exatamente o oposto, afastando os usuários: “Vocês ficarão desanimados e não vão mais querer visitar este site. Simplesmente o abandonarão e voltarão para a Wikipédia em inglês.”

Esses temores são compartilhados por Noah Ha’alilio Solomon, professor assistente de língua havaiana na Universidade do Havaí. Ele relata que cerca de 35% das palavras em algumas páginas da Wikipédia em havaiano são incompreensíveis. “Se esse for o havaiano que vai existir online, então fará mais mal do que bem”, afirma.

O havaiano, que esteve à beira da extinção há algumas décadas, vem passando por um esforço de recuperação liderado por ativistas e acadêmicos indígenas. Ver um havaiano tão mal escrito em uma plataforma tão amplamente utilizada como a Wikipédia incomoda Ha’alilio Solomon.

“É doloroso, porque nos lembra de todas as vezes em que nossa cultura e língua foram apropriadas indevidamente”, diz ele. “Temos lutado com unhas e dentes em uma árdua batalha pela revitalização da língua. Não há nada de fácil nisso, e isso pode criar obstáculos adicionais. As pessoas vão achar que esta é uma representação fiel da língua havaiana.”

As consequências de todos esses erros na Wikipédia podem se tornar evidentes rapidamente. Tradutores de IA, que sem dúvida incorporaram essas páginas em seus dados de treinamento, estão agora auxiliando na produção, por exemplo, de livros gerados por IA repletos de erros, destinados a aprendizes de línguas tão diversas quanto o inuktitut e o cree , línguas indígenas faladas no Canadá, e o manx, uma pequena língua celta falada na Ilha de Man. Muitos desses livros têm aparecido à venda na Amazon. “Era um completo absurdo”, diz Richard Compton, linguista da Universidade do Quebec em Montreal, sobre um volume que ele analisou e que se apresentava como um guia introdutório de frases para o inuktitut.

Em vez de tornar as línguas minoritárias mais acessíveis, a IA está criando um campo minado cada vez maior para estudantes e falantes dessas línguas. “É uma afronta”, diz Compton. Ele teme que as gerações mais jovens no Canadá, na esperança de aprender línguas em comunidades que lutaram bravamente contra a discriminação para transmitir sua herança cultural, possam recorrer a ferramentas online como o ChatGPT ou guias de conversação da Amazon e simplesmente piorar a situação. “É uma fraude”, afirma.

Uma corrida contra o tempo
Segundo a UNESCO, uma língua é declarada extinta a cada duas semanas. Mas se a Fundação Wikimedia, que administra a Wikipédia, tem alguma obrigação em relação às línguas usadas em sua plataforma é uma questão em aberto. Quando conversei com Runa Bhattacharjee, diretora sênior da fundação, ela disse que cabe às comunidades individuais decidirem qual conteúdo desejam que exista em sua Wikipédia. “Em última análise, a responsabilidade recai sobre a comunidade para garantir que não haja vandalismo ou atividades indesejadas, seja por meio de tradução automática ou outros meios”, afirmou. Bhattacharjee acrescentou que, geralmente, as edições só são consideradas para fechamento se houver uma reclamação específica a respeito delas.

Mas se não houver uma comunidade ativa, como um problema pode ser corrigido ou mesmo uma reclamação pode ser feita?

Bhattacharjee explicou que a Fundação Wikimedia vê seu papel nesses casos como o de manter a plataforma Wikipédia caso alguém queira revitalizá-la: “É o espaço que oferecemos para que eles cresçam e se desenvolvam. É aí que estamos.”

O sami inari, falado em uma única comunidade remota no norte da Finlândia, é um exemplo perfeito de como as pessoas podem tirar proveito da Wikipédia. Há quatro décadas, o idioma estava à beira da extinção; havia apenas quatro crianças que o falavam. Seus pais criaram a Associação da Língua Saami Inari em uma última tentativa de mantê-lo vivo. Os esforços deram certo. Agora, existem várias centenas de falantes, escolas que usam o sami inari como meio de instrução e 6.400 artigos na Wikipédia nesse idioma, cada um revisado por um falante nativo.

Esse sucesso destaca como a Wikipédia pode, de fato, fornecer a pequenas e determinadas comunidades um veículo único para promover a preservação de seus idiomas. “Não nos importamos com a quantidade. Nos importamos com a qualidade”, afirma Fabrizio Brecciaroli, membro da Associação da Língua Inari Saami. “Planejamos usar a Wikipédia como um repositório para a língua escrita. Precisamos fornecer ferramentas que possam ser usadas pelas gerações mais jovens. É importante que elas consigam usar o Inari Saami digitalmente.”

O sucesso foi tamanho que a Wikipédia foi integrada ao currículo das escolas de língua sami de Inari, acrescenta Brecciaroli. Ele recebe telefonemas de professores pedindo que ele escreva páginas simples sobre diversos assuntos, desde tornados até o folclore sami. A Wikipédia até se tornou uma ferramenta para introduzir palavras no sami de Inari. “Precisamos inventar novas palavras o tempo todo”, diz Brecciaroli. “Os jovens precisam delas para falar sobre esportes, política e videogames. Se não sabem como dizer algo, agora consultam a Wikipédia.”

A Wikipédia é um experimento intelectual monumental. O que está acontecendo com o inari sami sugere que, com o máximo cuidado, ela pode funcionar em línguas menos numerosas. “O objetivo final é garantir que o inari sami sobreviva”, diz Brecciaroli. “Talvez seja uma coisa boa que não haja um Google Tradutor em inari sami.”

Isso pode ser verdade — embora modelos de linguagem complexos como o ChatGPT possam ser usados ​​para traduzir frases para idiomas que as ferramentas de tradução automática mais tradicionais não oferecem. Brecciaroli me disse que o ChatGPT não é muito bom em sami inari, mas que a qualidade varia significativamente dependendo do que você pede para ele fazer; se você fizer uma pergunta no idioma, a resposta estará repleta de palavras do finlandês e até mesmo palavras inventadas. Mas se você fizer uma pergunta em inglês, finlandês ou italiano e depois pedir para ele responder em sami inari, o desempenho será melhor.

Diante disso tudo, criar o máximo de conteúdo online de alta qualidade possível se torna uma corrida contra o tempo. “O ChatGPT só precisa de muitas palavras”, diz Brecciaroli. “Se continuarmos inserindo material de qualidade, mais cedo ou mais tarde, conseguiremos produzir algo. Essa é a esperança.” Essa é uma ideia apoiada por diversos linguistas com quem conversei — a de que talvez seja possível acabar com o ciclo “lixo entra, lixo sai”. (A OpenAI, que opera o ChatGPT, não respondeu ao meu pedido de comentário.)

Ainda assim, é provável que o problema geral continue a crescer , já que muitas línguas não têm a mesma sorte que o sami de Inari — e seus tradutores de IA provavelmente serão treinados com cada vez mais dados de IA imprecisos. Wehr, infelizmente, parece bem menos otimista quanto ao futuro de seu amado groenlandês.

Desde que apagou grande parte da Wikipédia em groenlandês, ele passou anos tentando recrutar falantes para ajudá-lo a reativá-la. Ele apareceu na mídia groenlandesa e fez apelos nas redes sociais. Mas não obteve muita resposta; ele diz que isso tem sido desmoralizante.

“Não há ninguém na Groenlândia interessado nisso, ou que queira contribuir”, diz ele. “Não faz o menor sentido, e é por isso que deveria ser encerrado.”

No final do ano passado, ele iniciou um processo solicitando que o Comitê de Línguas da Wikipédia encerrasse a edição em groenlandês. Seguiram-se meses de debates acirrados entre dezenas de funcionários da Wikipédia; alguns pareciam surpresos com o fato de uma edição aparentemente saudável estar enfrentando tantos problemas.

Então, no início deste mês, a proposta de Wehr foi aceita: a Wikipédia em groenlandês será desativada e os artigos restantes serão transferidos para a Incubadora da Wikipédia, onde novas edições linguísticas são testadas e desenvolvidas. Entre os motivos citados pelo Comitê de Língua está o uso de ferramentas de IA, que “frequentemente produzem absurdos que podem deturpar o idioma”.

No entanto, pode ser tarde demais — erros em groenlandês parecem já ter se incorporado aos tradutores automáticos. Se você pedir ao Google Tradutor ou ao ChatGPT para fazer algo tão simples quanto contar até 10 em groenlandês correto, nenhum dos dois programas conseguirá.



You Might Also Like

No Comments

Leave a Reply