אחת התכונות המעניינות ביותר ב-Windows Phone של מייקרוסופט היא האפשרות לבצע פעולות שונות בעזרת דיבור: המכשיר כולל את מנוע זיהוי הדיבור של חברת TellMe, שנרכשה ע"י מייקרוסופט ב-2007 תמורת כ-800 מיליון דולר, הנחשב למנוע המרת דיבור-טקסט המתקדם בעולם. לחיצה ארוכה על כפתור ה"התחל" (או "בית") מפעילה את המנוע ומאפשרת למשתמש לתת למכשיר פקודות ללא מגע נוסף, כגון חיוג, חיפוש או הפעלת אפליקציות.

בעדכון ה-Mango, הצפוי לצאת לאוויר העולם בחודש הקרוב, יש כ-500 שיפורים למערכת ההפעלה הייחודית, אך מעט מאוד מהם היו מסוגלים להרשים אותנו בהדגמת וידאו כמו הגרסא המשופרת של ממשק הדיבור:

כפי שניתן לראות בהדגמה של אדם ליין מ-PocketNow, הממשק המשופר למד לדבר חזרה, ולנהל דו-שיח של ממש עם המשתמש במטרה להבין מה בדיוק הוא רוצה: הקראת הודעות טקסט כבר לא צריכה להיעשות ע"י דיבור רציף, הכולל את הפקודות שלפני ואחרי ההודעה. במקום זאת פשוט אמרו "סמס ל[שם]", והטלפון יפתח את חלון ההודעה, יגיד לכם מתי הוא מוכן להכתבה, ועוד יקריא לכם אותה חזרה בקולו הענוג כדי שתוכלו לוודא שלא נפלו בו טעויות מביכות כפי שקורות לעתים קרובות – במיוחד אצל המתחרה גוגל. הוא אפילו ישאל אתכם אם ההודעה יצאה טוב או שאתם רוצים להקריא אותה מחדש – בלי צורך להתחיל את כל התהליך מחדש; תוכלו גם להסתפק באמירת שמו הפרטי של הממוען (לשיחה או הודעה), והמכשיר יקריא לכם את כל השמות בספר הטלפונים בעלי אותו שם פרטי. כמו כן, ניתן לבקש מהמכשיר להפנות שיחה לדיבורית עוד לפני החיוג, או לשמוע את שם המתקשר בלי להסתכל על המכשיר. אבל החשוב מכל הוא שבעדכון המנגו ניתן לראשונה לבצע את כל הפעולות הקוליות בעזרת דיבורית בלוטות', בעוד בגרסא הקודמת נתמכה רק פקודת ה"חייג ל—" במיקרופונים אלחוטיים. בינתיים, כמובן, כל העסק תומך באנגלית בלבד.