Facebook cria o modelo de tradução automática multilíngue mais avançado


Os serviços de tradução de idiomas baseados em modelos de aprendizado de máquina estão permitindo que os diferentes idiomas deixem de ser um obstáculo, embora a Facebook AI acredite que pode ir mais longe.

Assim, após vários anos de trabalho, a divisão de Inteligência Artificial do Facebook oficialmente apresentada ao M2M-100, considerada como o primeiro modelo de tradução automática multilíngue (MMT), não depende do inglês para tradução entre dois idiomas, um marco dos quais eles se orgulham e dos quais compartilham seu código-fonte.

A esse respeito, explicam que muitos modelos traduzem primeiro de um idioma para o inglês e depois do inglês para o segundo idioma desejado. Por exemplo, se você quiser uma tradução do francês para o chinês, primeiro deve ser traduzida para o inglês e, em seguida, do inglês para o chinês.

A independência do inglês para traduzir entre outros idiomas permitiu que seu modelo superasse os modelos multilíngues avançados dependentes do inglês em dez pontos na métrica BLEU.

É também um modelo totalmente escalável e universal, ao contrário da maioria, que possui um modelo de inteligência artificial para cada linguagem e tarefa.

E para criar o M2M-100 foi necessária uma grande quantidade de dados para possibilitar seu treinamento, levando em consideração que ele suporta 100 idiomas diferentes.

Do Facebook IA, explicam que tiveram que recorrer a novas estratégias de mineração de dados, permitindo fornecer grandes volumes de frases de qualidade para direções de tradução arbitrárias que não envolvem o inglês, até 7,5 bilhões de pares de frases em 100 idiomas até o momento.

Também tem havido a aplicação de diferentes técnicas para tentar tornar o modelo eficiente e escalável, reduzindo sua complexidade e o nível de processamento computacional necessário.

Portanto, a conclusão do Facebook IA sobre esse desevolvimento é:

O novo modelo multilíngue do Facebook IA é o resultado de vários anos de trabalho pioneiro em MT em modelos inovadores, recursos de mineração de dados e técnicas de otimização.

Os interessados ​​em conhecer a fundo o novo modelo de tradução automática multilíngue criado pelo Facebook poderão ver todos os detalhes no anúncio oficial .