Microsoft Translator: Κάνοντας την πρόσβαση στη γνώση δίκαιη

0
Microsoft Translator: Κάνοντας την πρόσβαση στη γνώση δίκαιη

Η εργασία

Στις πρώτες μέρες της διαδικτυακής μετάφρασης, το λογισμικό ήταν αδέξιο και οι μεταφράσεις μετέφραζαν απευθείας κάθε λέξη, οδηγώντας συχνά σε σοβαρές παρεξηγήσεις στις αποχρώσεις της γλώσσας. Μεταφραστής της Microsoft έκανε τη μετάφραση ευκολότερη, πιο ακριβή, πιο γρήγορη και έκανε δυνατή τη σύγχρονη πολυγλωσσική επικοινωνία.

Μεταφραστής της Microsoft ξεκίνησε δουλεύοντας με τις πιο συχνά ομιλούμενες γλώσσες στον κόσμο. Σήμερα, προσθέτουν όλο και περισσότερες γλώσσες. Λιγότερο κοινές γλώσσες προστίθενται τακτικά στο Microsoft Translator και χρησιμοποιούνται για τη διδασκαλία των νεότερων γενεών, για τη διατήρηση γλωσσών που εξαφανίζονται και για να γίνει η πρόσβαση στη γνώση δίκαιη και προσβάσιμη, ανεξάρτητα από τη γλώσσα που μιλάτε.

Η πρόκληση

Το Microsoft Translator, που υποστηρίζεται από τις γνωστικές υπηρεσίες Azure, χρησιμοποιεί τεχνολογία AI για να αναλύει τη γλώσσα και να τη μεταφράζει σε άλλη γλώσσα. Για να γίνει αυτό, χρειάζονται ένα μεγάλο, με ακρίβεια σχολιασμένο σύνολο δεδομένων εκπαίδευσης για την προετοιμασία του μοντέλου μεταφραστή για κάθε γλώσσα.

Το Microsoft Translator δυσκολεύτηκε να αποκτήσει το μέγεθος του συνόλου δεδομένων που χρειαζόταν για ορισμένες από τις λιγότερο ομιλούμενες γλώσσες ή γλώσσες που καταγράφονται. Η δημιουργία ενός συνόλου δεδομένων απαιτεί χρόνο, γνώση και πόρους. Η μετάφραση σε γλώσσες που έχουν διαφορετικό αλφάβητο απαιτεί πρώτα φωνητική ομοιότητα και μεταγραφή, κάτι που μπορεί να γίνει με εξειδικευμένο προσωπικό και γλωσσολόγους. Πρέπει να βρείτε άπταιστα ομιλητές, να συλλέξετε σημεία δεδομένων, να σχολιάσετε κάθε σημείο δεδομένων και να εκτελέσετε δοκιμές διασφάλισης ποιότητας για να διασφαλίσετε την ακρίβεια.

Για να επιταχύνει το χρόνο τους στην αγορά, η Microsoft απευθυνόταν σε εξωτερικές πηγές για τη συλλογή και προετοιμασία των δεδομένων που χρειάζονται.

Η λύση

Ο Appen ήταν ο προμηθευτής της επιλογής του Microsoft Translator για να συνεργαστεί σε αυτό το γλωσσικό έργο. Παρέχαμε την τεχνογνωσία, τους πόρους και τις δημιουργικές λύσεις που απαιτούνται για τη δημιουργία μεταφρασμένων συνόλων δεδομένων από σπάνιες γλώσσες και την εκτέλεση των απαραίτητων ποιοτικών ελέγχων.

Η διαδικασία μας περιελάμβανε εργασία με τοπικούς πόρους για την παροχή μεταφράσεων από άπταιστα ομιλητές. Συλλέξαμε δεδομένα, σχολιάσαμε τα δεδομένα μεταγράφοντας και μεταφράζοντας κάθε κομμάτι δεδομένων και αξιολογήσαμε τα αποτελέσματα του μοντέλου για διασφάλιση ποιότητας και ακρίβεια. Αναπτύξαμε μια υπηρεσία που θα επέτρεπε στη Microsoft να δημιουργεί πολλαπλές μεταφράσεις για προτάσεις προέλευσης με διφορούμενες ως προς το φύλο – αντιμετώπιση της μετάφρασης και της μεροληψίας.

Η εργασία μας για το Microsoft Translator περιλάμβανε τρία από τα δεδομένα για τα στάδια του κύκλου ζωής της τεχνητής νοημοσύνης: προέλευση δεδομένων, προετοιμασία δεδομένων και αξιολόγηση μοντέλων από ανθρώπους. Ολοκληρώνοντας αυτήν την εργασία, βοηθήσαμε το Microsoft Translator να πάρει τα δεδομένα που χρειαζόταν στην υψηλότερη δυνατή ποιότητα και έγκαιρα.

Το αποτέλεσμα

Ως αποτέλεσμα της συνεργασίας μας, το Microsoft Translator έχει πλέον 110 γλώσσες διαθέσιμες για χρήση από τους καταναλωτές για μεταφράσεις και εργασία σε άλλες γλώσσες. Το Appen υποστήριξε τη διαδικασία συλλογής δεδομένων για 108 από αυτές τις 110 γλώσσες.

Ενώ υπάρχουν 110 διαθέσιμες γλώσσες, μερικές από τις νεότερες και λιγότερο ομιλούμενες γλώσσες περιλαμβάνουν:


Οι σύνδεσμοι οδηγούν σε αναρτήσεις ιστολογίου της Microsoft που παρουσιάζουν σε βάθος τη γλώσσα και τη διαδικασία προσθήκης της στο Microsoft Translator AI.

Ανεξάρτητα από τον πελάτη μας ή το μέγεθος του έργου, είμαστε περήφανοι που δημιουργούμε δεδομένα υψηλότερης ποιότητας, ώστε να είμαστε μέρος της λύσης βελτίωσης της τεχνητής νοημοσύνης. Τα αντιπροσωπευτικά δεδομένα είναι πώς κάνουμε την τεχνητή νοημοσύνη πιο ηθική. Η δουλειά μας με το Microsoft Translator για την αντιπροσώπευση όλων των γλωσσών, όχι μόνο εκείνων με τους περισσότερους ομιλητές, είναι μέρος του στόχου μας να κάνουμε την τεχνητή νοημοσύνη καλύτερη και πιο ηθική.

Schreibe einen Kommentar