עד כמה זיהוי התמונות של גוגל דרייב טוב?

כונן גוגל ל- iOS

מבין כל הדברים המרתקים שגוגל הכריזה עליהם בכנס מפתחי ה- I / O השבוע, אחד מלהיטי השינה היה Drive עבור iOS. 'Sleeper' עשויה להיות מילה חזקה מדי - צרף 'עבור iOS' לכל דבר וזה יקבל תשומת לב - אבל קשה לכל הודעה להתמודד על כותרות נגד פרויקט זכוכית, הנקסוס 7 עם ג'לי בין, ו צניחה חופשית. חלק ממה שגרם ל- Drive לסובב כל כך הרבה ראשים במהלך המרכז השני של יום 2 (מלבד איגוד ה- iOS) היה יכולות זיהוי התמונה שלה.

Drive משתמש בזיהוי תווים אופטי (OCR) כדי לבצע טריקים מסוימים. זה לא דבר חדש עבור גוגל - עוד בשנת 2009 Google Docs יכולה לקחת קובץ תמונה או PDF ולהמיר אותו למסמך. זה יכול גם לשנות את הכיוון של אחד מאותם קבצים באמצעות יכולתו לזהות תווים בדף. תכונות אלה הועברו ל- Drive, אך גם זיהוי תמונות בסיסי. זה אולי נראה לגמרי מדע בדיוני, אבל אם תעלה תמונה של פירמידה ל- Drive, תוכל לחפש אותה והמערכת תזהה אותה על סמך מה שגוגל יודעת על פירמידות. תכונה זו עשויה להיראות חדשה, אך גוגל השתמשה בזיהוי תמונות הן במשקפי גוגל והן (בצורה משופרת) חיפוש לפי תמונה.



כונן גוגל ל- iOSלא מזעזע מכך שגוגל תביא את התכונה הזו לגרסאות ה- iOS והאנדרואיד של דרייב, אבל היא שימושית במיוחד בפלטפורמה שבה אין לך כלי חיפוש מתקדמים לנפות את 5GB הנתונים שלך. עיקר המחשוב מתרחש בצד השרת ולכן זה לא שה- iPad שלך צריך להיות מסוגל לזהות את הפירמידה הזו, אתה רק צריך שיהיה לך חיבור לאינטרנט כדי שגוגל תוכל להשאיל חלק מקסמי החיפוש שלה לקבצים שאתה '. הוצבתי ב- Drive.



ערכתי בדיקה לא פורמלית של יכולות זיהוי התמונה של דרייב תוך שימוש במשאבים מסוימים ברחבי האינטרנט, כולל זוגות מסמכים ואז כמה תמונות גנריות שנבחרו באופן אקראי. וידאתי שהם נקיים מכל נתונים שעשויים לעזור לכלי החיפוש לזהות אותם (EXIF, שמות קבצים וכו ') ואז העליתי אותם ל- Drive. על פי ההדגמה של גוגל אני אמור להיות מסוגל לזהות כל אחד לפי תיאור בסיסי של כל אחד מהם. כך זה עבר ...

  • 2 תמונות חתולים - זוהה נכון 2 מתוך 2 עם המונח 'חתול'
  • דימוי כלב - 1 מתוך 1 עם המונח 'כלב'
  • 4 תמונות פירמידה - 4 מתוך 4 עם המונח 'פירמידה'; 1 מתוך 4 עם 'גיזה'
  • תמונת Samsung Galaxy Tab - לא זוהה כ'טאבלט '; אכן הזדהה כ'סמסונג '
  • תמונת מחשב נייד של Dell - לא זוהה כ'מחשב נייד '; אכן הזדהה כ- 'Dell'
  • תמונה של הכונן הקשיח - לא זוהה כ'כונן קשיח '; אכן זוהה כ'כונן 'ו'דיסק'
  • תמונת המבורגר - מזוהה כ'המבורגר 'אך לא כמונחים מעורפלים יותר כמו' אוכל 'או' ארוחת ערב '
  • JPG של חשבונית - מזוהה כ'חשבונית 'ועל ידי שמות החברה המשמשים בה
  • טופס מס 1099, PDF - מזוהה על ידי 'מיסים', 'טופס מס', '1099' ו- '1099 שונות'
  • הזיהוי נכשל - תמונות שצילמתי של מקרר, כרטיס גרפי, טלפון חכם ונורה

עם מערך הנתונים המוגבל שלי היעילות של זיהוי התמונות של גוגל הייתה מעורבת. זה עבד טוב מאוד עם טקסט בתמונות, מספיק טוב עם תמונות שנמצאות במאגר התמונות של גוגל, ואז זה מעד לגמרי עם התמונות האישיות שלי. נתתי למערכת מספיק זמן לעבד את הנתונים (החלק היותר טוב של שעה) אבל היא פשוט לא הצליחה להבין כמה.



נהיגה

כונן גוגל: 'wtf זה?'

אולי זיהוי התמונה אינו חדש במיוחד עבור גוגל, אך החלק המרשים כאן הוא שהחברה הצליחה לדחוס אותו לאפליקציה לנייד, להחיל אותה על מערך הנתונים האישיים שלי בענן ואז לגרום לאפליקציה לתקשר עם הענן. בצורה מהירה. בטח, רוב העבודה נעשית מיד לאחר העלאת הקובץ, אך יכולות הזיהוי והקטלוג הם לא פחות ממה שהיינו מצפים מגוגל.

מלבד יכולות ה- OCR והנוחות שבשימוש בחשבון Google שלי, Drive עבור iOS הוא בעצם מתחרה נאות ב- Dropbox. זו חוויה חלקה ועם ביצועים מצחיקים באייפד 3 שלי, בנוסף יש לי את היכולת לבחור בדיוק אילו קבצים אני רוצה לאחסן במצב לא מקוון ואילו לא. האפליקציה מקלה לראות עם מי שיתפתי קובץ, וזה נהדר עבור אנשים בקבוצות. כלים מתקדמים (וכמעט מוסתרים) כוללים את היכולות לשתף עם אנשים ברשימת אנשי הקשר שלך ולשנות שם לקבצים.



בנוסף להיותו טריק מרשים, ה- OCR מעניק ל- Drive יתרון בולט על פני Dropbox. שירות זה מסוגל לחפש לפי שם קובץ ויש לו כמה תכונות מגניבות, כמו היכולת לשלוח קישור בדוא'ל, אך כלי החיפוש אינו יכול אפילו לצלול לטקסט של מסמך PDF. וכפי שאנחנו יודעים, גוגל כן רק נהיה חכם יותר בעוד ששירותים אחרים מתקשים להתמודד מול בסיס המשתמשים, כוח המחשוב וגרף הידע המסיבי שלו.

המשך לקרוא למידע נוסף על כיסוי ה- I / O 2012 של 2007es.com

Copyright © כל הזכויות שמורות | 2007es.com