מיקרוסופט מדגימה מתרגם אוניברסלי לאנגלית-סיני ששומר על קולך ומבטא

מתרגם אוניברסלי מסע בין כוכבים

באירוע בסין, ראש המחקר של מיקרוסופט, ריק ראשיד, הפגין מנוע תרגום לנאום-לנאום בזמן אמת לאנגלית-למנדרינית. לא רק שהתרגום מדויק מאוד, אלא שהתוכנה גם שומרת על המבטא והאינטונציה של המשתמש. אנחנו לא מדברים כאן רק על מתרגם דיגיטלי ורובוטי - זה ממש בתחומים של רופא ש אוֹ מסע בין כוכבים תרגום אוניברסלי.

הדרך הטובה ביותר להעריך את הטכנולוגיה הזו היא לצפות בסרטון הבא. בשש הדקות הראשונות לערך מסביר ריק ראשיד את הקושי המהותי בתרגום מחשבים, ואז הדקות האחרונות מדגימות למעשה את מנוע התרגום לדיבור לדיבור באנגלית למנדרינית. למרבה הצער אני לא מדבר סינית, ולכן אני לא יכול להעיד על אמיתות התרגום, אבל הקהל - כ -2,000 סטודנטים סינים - נראה די מתרשם. מתורגמן מקצועי באנגלית / סינית גם העיר לי כי תרגום המחשב מפתיע לטובה; לא ממש עד לרמת התרגום האנושי, אבל זה מתקרב.





יש, כמובן, הרבה מכשפים טכנולוגיים מתרחש מאחורי הקלעים. בתור התחלה, יש להכשיר את התוכנה - הן עם כמה שעות של סינית מדוברת, והן שעה של האנגלית המדוברת של ריק ראשיד. מכאן, התוכנה למעשה מפרקת את הדיבור שלך למרכיבים הקטנים ביותר (פונמות), ואז מועכת אותם יחד עם המקבילה הסינית, ויוצרים מפה גדולה של צלילים באנגלית לצלילי מנדרינה. ואז, במהלך ההצגה על הבמה בפועל, התוכנה ממירה את נאומו לטקסט (כפי שאתה רואה על המסך השמאלי), הטקסט שלו לטקסט מנדרינית (מסך ימין) ולאחר מכן את ה- Mash-up של רשיד / סיני שנוצר במהלך האימון. נעשה שימוש בתהליך כדי להפוך את הטקסט למילים מדוברות.

לתוצאה הסופית בהחלט יש רמז חזק למיקרוסופט סם דיגיטציה ורובוטית, אבל זה מפתיע עד כמה המבטא, הגוון והאינטונציה של ראשיד נשמרים.



מבחינת הדיוק, מיקרוסופט אומרת כי למערכת השלמה יש שיעור שגיאות של בערך מילה אחת בשמונה - שיפור של 30% לעומת הטובה הקודמת מילה אחת מכל חמש. שיפור דרמטי כזה התאפשר באמצעות רשתות עצביות עמוקות, טכניקת למידת מכונה שהגה ג'פרי הינטון מאוניברסיטת טורונטו. רשת עצבים עמוקה היא בעצם רשת עצבית מלאכותית (תוכנה שמדגמנת אלפי 'נוירונים' מחוברים זה לזה), אך עם כמה שינויים כך שהיא מחקה מקרוב את התנהגות המוח האנושי.

בהמשך, השאלה הגדולה היא מתי תוכנת התרגום לדיבור לדיבור של Microsoft Research אכן תמצא את דרכה לשוק - וכן, אם תהיתם, התוכנה אינה מוגבלת רק לאנגלית וסינית; ניתן להשתמש בכל 26 השפות הנתמכות בפלטפורמת הדיבור של מיקרוסופט, כולל מנדרינית לאנגלית. מקרה השימוש הברור ביותר יהיה בסמארטפון Windows Phone 8 (או 9?) שלך, או בסקייפ: אתה יכול להתקשר לחברה בסין או בגרמניה או בברזיל, לדבר בדרך כלל באנגלית והם היו שומעים את קולך בשפה המקומית שלהם. . אתה יכול גם להשתמש בסמארטפון שלך כמתרגם אוניברסלי בזמן נסיעה. כפי שניתן לראות למטה, מיקרוסופט השתעשעה בתרגום טלפון לטלפון בזמן אמת עד 2010:

יש להניח שמיקרוסופט עובדת על יישומים כאלה - אך ככל הנראה היא מתאפקת על ידי שיקולים מעשיים, כגון כוח העיבוד הנדרש לביצוע תרגום דיבור לדיבור, או מתן ממשק קל לשימוש לתהליך ההדרכה / הלמידה. תהליך ההדרכה עצמו עשוי לדרוש כוח עיבוד רב יותר מכפי שמשתמש ביתי יכול לספק גם כן. תמיד יש את הענן!

Copyright © כל הזכויות שמורות | 2007es.com