Cas d’integració de la TA: Microsoft

Maite Melero i Nogués
Grup de Lingüística Computacional
Universitat Pompeu Fabra

Els Serveis de Suport de Productes (Product Support Services, PSS) de Microsoft té una base de coneixement formada per més de 140.000 articles (80 milions de paraules) que creix constantment. Aquesta base de coneixement proporciona suport en línia a centenars de milers d’usuaris de tot el món. Degut als alts costos de traducció i a limitacions de temps, només es tradueixen a les principals llengües europees i asiàtiques uns pocs milers d’articles cada any, mentre que la immensa majoria ha de consultar-se en l’original anglès. La creixent comunitat multilingüe d’usuaris de productes de Microsoft obliga a mantenir un costós servei telefònic d’assistència tècnica en molts idiomes. Per tal de donar solució a aquest problema, en els últims anys s’ha començat a utilitzar MSR-MT per traduir automàticament a diverses llengües, tots els articles que quedaven sense traduir.

MSR-MT és un sistema híbrid de TA, desenvolupat pel grup de Processament de Llenguatge Natural a Microsoft Research, que integra mòduls lingüístics amb components de transferència entrenats sobre textos bilingües de documentació tècnica de la pròpia empresa. L’any 2002 es va fer una prova pilot amb la traducció de 125.000 articles de la base de coneixement de PSS al castellà. Pocs mesos desprès, la satisfacció dels usuaris, mesurada a través d’una mostra de 60.000 visites al web de suport de Microsoft, arribava al 86%, 12 punts per sobre de la mesurada sobre els usuaris dels articles en anglès. Aparentment, la possibilitat d’accedir als articles en la pròpia llengua feia als usuaris molt tolerants envers la menor qualitat de la traducció. En termes generals, l’índex d’usabilitat dels articles traduïts automàticament era d’un 50%, comparat amb 51% dels articles traduïts manualment.

Els resultats de la prova pilot van demostrar que el potencial de MSR-MT per a disminuir el volum de trucades al servei de suport telefònic era similar al dels articles traduïts manualment i van conduir, a l’abril de 2003, al desplegament total de la traducció automàtica al castellà dels articles de suport tècnic. Aquest desplegament va ser seguit de la incorporació de nous idiomes. El març de 2004 es van publicar al web de suport tècnic de Microsoft els articles traduïts automàticament al japonès i a finals d’aquell mateix any, es va fer el mateix amb el francès i l’alemany. Últimament, s’han incorporat també l’italià, el xinès i el coreà.

Per accedir aquests articles cal anar al lloc web http://support.microsoft.com, clicar “International Support” (o “Soporte internacional”) i escollir el pais corresponent: Spain (o algun altre país hispanoparlant) per al castellà, Japan per al japonès, etc. Es poden fer llavors consultes a la base de coneixement (Knowledge Base) i apareixerà un llistat d’articles traduïts a la llengua respectiva. Aquells que han estat traduïts de forma automàtica (la majoria) van acompanyats d’una icona amb dos petits engranatges i en obrir l’article apareix també un text ressaltat que adverteix l’usuari que l’article ha estat traduït automàticament.

El component d’aprenentatge estadístic sobre textos tècnics prèviament traduïts dona a MSR-MT la possibilitat d’adaptar-se a les característiques requerides pels articles de PSS i aporta així una solució al problema de la traducció de la seva base de coneixement, alhora eficient i molt competitiva comparat amb altres mètodes, com són la traducció humana, les memòries de traducció, o altres sistemes de traducció automàtica que requereixen costosos processos d’adaptació manual al tipus de text.

Bibliografia

Stephen D. Richardson (2004): Machine translation of online product support articles using data-driven MT system. Machine translation: from real users to research: 6th conference of the Association for Machine Translation in the Americas, AMTA 2004, Washington, DC, September 28 – October 2, 2004; ed. Robert E.Frederking and Kathryn B.Taylor (Berlin: Springer Verlag, 2004); pp. 246-251.

Desembre 2006