audiosearch, um buscador de conteúdo em podcasts

Postado em

Os podcasts (arquivos de áudio transmitidos via internet) já fazem parte do dia a dia de milhares de internautas, porém, o problema é que não há uma versão de texto nos mesmos, sendo super difícil encontrar conteúdo usando um buscador tradicional.

E é exatamente isso que pretende solucionar audiosear.ch, um novo projeto que indexa podcasts e identifica o som para detectar palavras, permitindo, assim, a busca através de textos (assuntos de qualquer tipo), para conseguirmos podcasts relacionados ao que queremos. É possível, por exemplo, buscar podcasts por temas e etiquetas, sem depender do conteúdo existente.

Os resultados incluem o texto do podcast, um trabalho realizado de forma automática (podendo haver erros) e um diagrama indicando o momento do podcast em que é mencionado o que buscamos.

captura-21

No momento só há podcasts em inglês, e é difícil que seja ampliado para outros idiomas em um curto período de tempo, já que a tecnologia que extrai texto a partir de áudio muda muito de um idioma a outro, porém, podemos testá-lo para saber como estão seus avanços nessa área tão complexa.