Aneu a la barra d'eines

Transcriure àudios, vídeos o diccions a text escrit

Heu hagut de transcriure alguna vegada? L’ofici del periodisme coneix bé la necessitat, però com a docents, també són moltes les ocasions en les quals ens pot sorgir la necessitat. Els motius podrien ser variats: publicar un article a partir d’una entrevista, subtitular un vídeo, facilitar l’accessibilitat a persones amb problemes auditius, etc.
L’equip de coordinació TIC vam haver de transcriure una entrevista gravada en un podcast per poder publicar-la en un dels primers butlletins CvTIC. Per a la qual cosa vam haver de fer una recerca d’eines que ens permeteren fer eixa tasca de la forma més eficient i ràpida possible. Hem de dir que no hem trobat cap eina “miracle” i que, depenent del tipus de text a transcriure i de la finalitat de la transcripció, és possible que la millor manera siga la de tota la vida: mecanografia nua i crua.
En el nostre cas, es tractava d’una entrevista de més d’una hora de durada, en la qual, dos interlocutors feien una xarrada informal al voltant de la tasca d’un dels dos. En eixe cas, transcriure per publicar no és fàcil, ja que hi ha moltes frases i paraules repetides, frases ganxo, falques, vocals allargades. A més de la dificultat d’extreure la informació més important d’una conversa en registre informal per deixar-la escrita (o bé la dificultat de plasmar per escrit la informalitat de la conversa).

Tot i això, us deixem les 4 eines trobades que, des del nostre punt de vista, poden ser més útils en aquesta tasca. Al final trobareu un parell d’enllaços amb més eines per seguir explorant, ja que aquest camp està en constant evolució i els avanços poden ser ràpids.

  1. oTrancribe és una aplicació web gratuïta per a mecanografiar àudios i vídeos mentre s’escolten, permet reproduir, parar, avançar i anar enrere sense treure les mans del teclat, així com modificar la velocitat de reproducció. Està creada per Elliot Bentley i és de codi obert, sota els termes de la llicència MIT. Tot i ser una eina web, respecta la privacitat de les dades, ja que els fitxers i la transcripció no abandonen mai el vostre navegador.
  2. Happy Scribe. És una plataforma capaç de reconéixer l’àudio de 80 idiomes i dialectes diferents i convertir-lo en text. Així doncs, l’usuari tan sols ha d’adjuntar-hi un arxiu d’àudio d’un màxim de 80 minuts i la pàgina envia un enllaç amb la transcripció quan està llesta (amb una demora entre deu minuts i un quart d’hora). Creada per Marc Assens i André Bastié, la plataforma funciona amb machine learning, és a dir, que aprén contínuament a mesura que s’hi aboquen més i més transcripcions. Amb la qual cosa cal anar amb compte, ja que significa que les dades es transfereixen als servidors amb els quals treballa i caldrà observar els termes i condicions per conéixer amb detall on es guarden aquestes dades i qui hi té accés. Més informació sobre Happy Scribe en aquest article: Dos estudiants posen fi a l’etern drama de transcriure àudios.
  3. Google Docs: La ferramenta ofimàtica de Google ofereix des del menú Eines (només si s’utilitza amb els navegadors Chrome, Chromium, Brave o derivats) la possibilitat d’introduir text dictat.
    En aquest cas Google detecta molt bé la nostra veu, tant en català com en castellà. Fins i tot permet utilitzar determinades paraules clau per posar signes de puntuació. L’inconvenient principal és que no hem sigut capaços de fer que detecte un àudio gravat. Ni per l’entrada de so del PC, ni amb un altaveu acostat al micròfon, ni res. Sembla que Google detecte d’alguna manera que es tracta d’una gravació i no transcriu. També cal advertir que totes les dades passen per servidors de Google, de forma que caldrà de nou llegir els termes i condicions si volem estar al cas sobre què passa amb les dades proporcionades. El motor de transcripció de Google és molt popular, ja que permet que s’utilitze també en eines de tercers mitjançant una API, com per exemple, Text-me, amb una interfície senzilla que es pot utilitzar des de qualsevol dispositiu.
  4. Speech to text: En aquest cas l’eina en línia Speech to Text no transcriu texts en català, però sí castellà i altres idiomes. L’avantatge principal, respecte de la ferramenta anterior, és que, a més de poder dictar des del micròfon, sí que es pot transcriure un fitxer d’àudio. Amb el botó “Upload Audio File”, selecciones el fitxer on està el text i el reprodueix al mateix temps que el transcriu automàticament. Aquest botó “upload” ja ens dona la pista que les dades aniran a parar a algun servidor i és allí on es fa el procés. Caldrà anar amb compte, doncs, amb la política privadesa d’aquesta eina. Aquesta és l’eina que vam utilitzar per transcriure l’entrevista que mencionàvem al principi, ja que el contingut estava publicat amb llicència de continguts Creative Commons i la distribució de les dades no era un problema.

Aquestes quatre eines no són les úniques, podeu trobar més en els següents articles: