ما قصة صوت سيري الجديد؟

3 دقائق
بالإضافة إلى الصوت الجديد، يمكن لسيري أيضاً أن تترجم العبارات بصوت مرتفع إلى 5 لغات.

هل سمعت؟ سيري، تلك الشخصية الافتراضية التي تتحدث من هاتفك الآيفون، أصبح صوتها مختلفاً الآن. يتم نشر الصوت الجديد رسمياً اليوم كجزء من أحدث نظام لتشغيل الهواتف المحمولة من آبل، المسمى "iOS 11". يمكن لنبراتها الصوتية الجديدة أن تجعل طبقتها الصوتية أعلى وأصغر سناً. لقد باتت أكثر مرحاً، وأكثر جاذبية. الأهم من ذلك، هو أنها تبدو بشرية بدرجة أكبر.

إليكم كيف ظهر صوتها إلى العالم: قام أحدهم بقراءة كتاب بصوت مرتفع، وقامت آبل بتسجيل ذلك الصوت. لكنتها الأميركية في اللغة الإنجليزية جاءت على لسان شخص معين، كما كان الحال، على سبيل المثال، مع لكنتها البريطانية.

كان هدف آبل من هذه التسجيلات جمع كلمات ومقاطع صوتية طبيعية، أو الأصوات التي تكوّن كلماتنا. انطلاقاً من هذا الهدف، تستخدم آبل التعلم الآلي لتركيب هذه المقاطع الصوتية معاً لجعل صوتها أثناء الكلام يبدو طبيعياً قدر الإمكان. من خلال التركيز على تجميع أصوات الكلمات تلك بالأسلوب الصحيح، تأمل آبل أن تتمكن من اختلاق صوت يركز على نطق المقاطع الصوتية بشكل صحيح، وبالتالي لن يبدو صوت الشخصية الافتراضية اصطناعياً إلى حد كبير.

لفهم صفات الصوت الجديد لسيري بشكل أفضل، أرسلت مقاطع لها وهي تتحدث الإنجليزية بلهجة أميركية إلى "مولي بابل"، الأستاذة المساعدة في قسم اللسانيات في جامعة كولومبيا البريطانية. (أجل، فهي خبيرة في اللغات وكنيتها "بابل"، تتم تهجئتها ككلمة "برج" تماماً).

طلبت مني بابل أن أسجل كلمات محددة (من اللغة الإنجليزية) بينما تقولها سيري – من بينها الكلمات "باستا pasta"، "بوول pool"، و"بووت boot" – ومقطعاً نصياً معروفاً في علم اللغة، يحتوي على عدد كبير من أصوات الكلمات. وهو يبدأ بالعبارة: "Please call Stella".

كيف كانت ردة فعلها؟ تقول بابل: "لقد ضحكت قليلاً عندما سمعت لفظها لعدد من حروف العلة". وتضيف: "إنها تمثل نموذجاً عن أحد أبناء كاليفورنيا". وقد أدركت بابل ذلك من خلال الطريقة التي لفظت بها سيري المقطع "oo" ضمن الكلمتين "pool" و"boot"، بالإضافة إلى الطريقة التي لفظت بها حروف العلة الأخرى. من خلال المكافئ اللغوي لحساب تقريبي قامت به، تمكنت بابل من مقارنة صوت سيري بمتحدثين مشابهين ضمن أرشيف للهجات، وقد أكدت أن سيري بدت أكثر شبهاً بأبناء كاليفورنيا.

ليس هذا فحسب، فبابل تشير إلى أن صوتها يبدو رخيماً (أجشّاً) وعالي النبرة، وهما عاملان يمنحان معاً شعوراً فتياً. تقول بابل: "إنها تبدو شابة حقاً"، وتضيف بأن صوتها يتطابق مع بشكل أفضل مع امرأة أميركية في أواخر سن المراهقة، أو في العقد الثالث من عمرها.

تقول بابل؛ تلك الرخامة في الصوت، وهي مصطلح يشير إلى كمية الهواء الذي يمر فوق الحبال الصوتية، تجعل صوتها يبدو سليماً.

سألتها بعد ذلك؛ عن نوعية الأصوات التي يرغب الناس بسماعها عندما تصدر عن الشخصيات الافتراضية في أجهزتهم، تلك الأصوات التي تقدم لنا المعلومات عن الطقس والمواعيد الخاصة بنا.

تقول بابل: "أعتقد أنه تم تصميمها لكي تبدو مستعدة لإرضاء من يستمع لها". وتضيف: "لكي أكون صادقة فيما أقول، ربما كان ذلك جزءاً من الصورة النمطية غير المنصفة التي لدينا عن الشابات". يمكنك أن تحول الصوت بسهولة إلى صوت ذكري، وهو صوت متاح منذ العام 2013، ضمن أعدادات هواتف آيفون.

تضيف بابل: "هناك مطالب بوجود لكنة نسمعها في أجهزتنا، حيث تكون مألوفة لنا، وتبدو شبيهة بنا نوعاً ما. من شأن ذلك أن يساعدنا على مقاومة الشعور وكأننا نتلقى تعليمات".

ولكن هل يسير الأمر بشكل جيد؟

تشير بابل؛ إلى أنه في نهاية المطاف، لا يتعين على المساعد الافتراضي أن يمتلك صوتاً يبعث على البهجة بحيث يسهل فهمه فحسب؛ وإنما ينبغي له أيضاً أن يفهم المستخدم بوضوح. مع نظام التشغيل "iOS 11"، يمكن لسيري أن يترجم لفظياً العبارات الإنجليزية المنطوقة إلى 5 لغات مختلفة.

لا شك أن الترجمة ميزة مفيدة، ولكن الغاية الرئيسية من المساعد الافتراضي هي معرفة ما طلبته منه، والرد عليك بالأسلوب الصحيح. إن طلبت من سيري أن تتصل لك لتأمين خدمة نقل من شركة أوبر، ولكنها لا تفهم معنى كلمة "أوبر" فتطالبك بأن تختار بين تطبيقي "أوبر" و"ليفت" على هاتفك الذكي، فستشعر بالإحباط بصرف النظر عما يبدو عليه صوتها. (شهد معدل ارتكاب سيري للأخطاء في التعرف على الكلمات انخفاضاً كبيراً منذ أطلقت آبل المساعد الصوتي لأول مرة في العام 2011).

إنها نقطة هامة يشير إليها "تيمو باومان" بدوره، وهو عالم النظم في جامعة كارنيجي ميلون؛ الذي يدرس الأنظمة الحاسوبية الناطقة مثل "سيري". حيث استمع إلى كلامها أيضاً. (استمع كل من بابل وباومان إلى صوت سيري عندما كان "iOS 11" لا يزال نسخة تجريبية، قبل إصداره رسمياً هذا الشهر).

يقول باومان: "يبدو لي أن الصوت الجديد في الواقع لديه شخصية أكثر وضوحاً مما كان يبدو عليه الصوت السابق". ويضيف: "كان الصوت السابق أكثر برودة وأقل وداً". على سبيل المثال، في وقت سباق من هذا العام، عندما كشفت آبل الستار لأول مرة عن النطاق الصوتي الجديد لمساعدها الرقمي (ذي الشخصية الأنثوية)، أظهرت قدرتها على نطق كلمة "مشمس sunny"، بثلاث نبرات صوتية مختلفة، وهو مثال آخر عن محاولتها لكي تبدو بشرية وطبيعية بدرجة أكبر.

إن الثقة والشخصية التي يتضمنها الصوت، يعكسان كفاءة المتحدث، ما يعني أنه عندما يفشل المساعد الرقمي حتماً، كما يحدث مع كافة المساعدات الرقمية، فإن عدم التوافق بين نبرة الصوت والأداء قد يكون أكثر وضوحاً.

يقول باومان: "يبدو الصوت صادراً عن شخصية واثقة مما تقول". ويضيف: "هذا يعني أنه يتعين على آبل أن تحرص على قدرتها على تحقيق ما تقوله. فإن قلت شيئاً غبياً بواسطة هذا الصوت، فسيبدو غبياً على نحو مضاعف".

ووفقاً لملاحظة بابل بأن سيري تنطق بلكنة سكان كاليفورنيا، يمكنك أن تسألها دائماً عن موطنها الأصلي. وإن فعلت ذلك، فقد تخبرك بما يلي: "كما هو مكتوب على العلبة... لقد تم تصميمي من قبل شركة آبل في كاليفورنيا".

المحتوى محمي