רוצים לדעת איך ייראה העתיד הקרוב? תעקבו אחר הילדים. באיזו תדירות הם מקלידים משהו בטלפון? ובאיזו תדירות הם מקליטים הודעות קוליות בוואטסאפ, או משתמשים בחיפוש קולי? אני מנחש שהפעולות הנפוצות יותר הן הפעולות הקוליות. הטכנולוגיה הקולית, המאפשרת לנו לחפש, להזמין, ובאופן כללי לבצע כמעט הכל באמצעות מיתרי הקול ומכשיר חכם, עשתה קפיצה חדה בשנים האחרונות, וכיום כל אחת מענקיות הטכנולוגיה מחזיקה בפלטפורמה קולית: לאפל יש את סירי, לגוגל את אוקי גוגל, לאמזון את אלכסה ולמייקרוסופט את קורטנה, והאפליקציות המתבססות על הפלטפורמות הללו הולכות ומתרבות.

והמשתמשים? אם להאמין לנתונים, בשנה האחרונה, הם מפטפטים עם המכשירים החכמים כמעט ללא הפסקה. כשחושבים על זה, זה לא באמת מפתיע, הממשק הקולי טבעי לנו, אנחנו רגילים לתקשר באמצעות דיבור, זה לא מצריך מאמץ מיוחד (כמו במקרה של הקלדה), וזה מפנה אותנו לביצוע משימות אחרות במקביל. המספרים משקפים עד כמה זה נוח לנו: בשנת 2020, 50% מהחיפושים בגוגל היו חיפושים קוליים, ועל פי מחקר שבוצע השנה בארה"ב, כ-27% מהכניסות לאתרים דרך מנוע חיפוש נבעו מביצוע חיפוש קולי. אין פלא אם כן שחברות רבות מבקשות לפגוש את הלקוחות שלהן באמצע הדרך, ולהעניק להם חוויית הזמנה קולית. רשת Starbucks הייתה בין הראשונות שקפצו על הגל. החברה אפשרה ללקוחותיה להזמין קפה דרך פקודות קוליות באפליקציה. כולנו יודעים עד כמה ספציפי הקפה שלנו יכול להיות, ואיזו רשימה ארוכה של הנחיות אנחנו מעבירים למלצר או למלצרית האומללים. אפשר לצפות בסרטון פה בהמשך, ולראות כיצד האפליקציה של Starbucks עומדת באתגר בכבוד.

מאחורי הקלעים של הביצוע המוצלח, נמצאת טכנולוגיה מורכבת למדי: המערכת מתרגמת את הפקודה הקולית לטקסט, מאמתת את הטקסט מול קטלוגים שונים, ומקריאה חזרה למשתמשת את מה שהמערכת "הבינה" והמשתמשת נדרשת לאשר. במקרים אחרים, הדרישה מתורגמת בו במקום בתוך האפליקציה והמשתמשת מקבלת חיווי, לרבות תמונות, להזמנה שלה. מאז, הטכנולוגיה הקולית ממשיכה להתפתח בצעדי הענק, והגענו היום לנקודה בה אנו יכולים לבקש בנונשלנטיות משעוני האפל שלנו המלצה על מסעדה. זה הישג טכנולוגי מרשים, שלא היינו מגיעים אליו, אלמלא ההתפתחויות האחרונות בתחומים של בינה מלאכותית, NLP ועוד.

 

בימים האלה, מערכות ההפעלה של המובייל יותר ויותר תומכות באפשרות לבצע פעולות קוליות, אבל לא רק במסגרת סט הכלים של העוזרות הקוליות עצמן, אלא גם נפתחה האפשרות למפתחי אפליקציות חיצוניים להגדיר פעולות לביצוע דרך פקודה קולית, ולשייך את הפקודה הזאת לעוזרות הקוליות, כך למשל, שבמתן פקודה כמו "העבירי לי כסף", סירי תדע להפעיל את האפליקציה שלנו במצב של העברת כסף. להערכתי, לא רחוק היום בו כמות האפליקציות הקוליות תוכל להתחרות בכמות האפליקציות שקיימת באפסטור או בגוגל פליי והממשק הקולי יהפוך לדרך המועדפת עלינו לביצוע הזמנות, הפעלת מכשירים, העברת כספים ועוד.