في مشهد معروف من مسلسل الخيال العلمي الشهير “ستار تريك”، يتحدّث الكابتن كيرك بلغته الإنجليزية، ليصدر الكلام بصوته ونبرته إنما بلغة كائن فضائي قادم من مجرّة أخرى، في تجسيد بديع لحلم سقوط حاجز اللغة المنيع. واليوم في زمن (سيري) وسواها من التقنيات الفورية للترجمة النصيّة، كم نحن قريبون من تجسيد حلم الترجمة الفورية للكلام المنطوق؟
قد يستشهد البعض بتطبيق الترجمة Translate من غوغل ، الذي حلّ لنا أزمة ترجمة النصوص المكتوبة آنياً. لكن خبرتنا نحن العرب بالذات مع نماذج فادحة في الترجمة الخاطئة ستؤكد أننا لا نزال بعيدين عن الاعتماد المطلق على الذكاء الآلي في هذا الصدد. ناهيك عن أنك لو كنت في اليابان واضطررت لأن تسأل عن موقع مطعم معيَّن، فإنك لن تستوقف شخصاً في الشارع لتكتب النص العربي عبر مترجم غوغل وتعرض ترجمته اليابانية على من تسأله. ألن يكون من الرائع أن يسمع الآخرون سؤالك بصوتك وباللغة التي تحددها أنت؟ وآنياً؟
فماذا يقول الواقع العلمي عن الترجمة الفورية وتقنيات التعرف على النطق اليوم؟
الإجابة عن هذا السؤال تدفعنا إلى التعمق قليلاً والتفرع في الموضوع أكثر. فعلماء اليوم يرون أن الذكاء الاصطناعي الفعلي لا يزال بعيداً، وأن كثيراً مما نراه على شاشاتنا من رجال آليين وأجهزة تحاكي وتنافس وحتى تحاول أن تمحو الذكاء البشري من الوجود ما زالت كما هي تسمى، خيالاً علمياً فحسب. وعلى الرغم من هذه النبرة التشاؤمية، لابد من أن نعترف بأن تقنيات التعرف على النطق وغيرها من التقنيات اللغوية قد أحرزت تقدماً باهراً في السنوات الأخيرة يكفي لأن تسمى ذكاءً اصطناعياً، وإن كان استخدام الاسم بتصرف، ولكنه كافٍ لأن يجعل هذه التقنيات صالحة للاستخدام وقادرة أن تحلَّ محل البشر في كثير من المهام دون الحاجة إلى التدخل البشري في أغلب الحالات.
عالمنا اليوم، الذي يكبر فيه صغارنا وهم يسلمون بالتقنية الذكية كتحصيل حاصل، أصبح فيه التعرف النطقي أمراً اعتيادياً، فبيننا تطبيقات “سيري” من أبل، و “كورتانا” من مايكروسوفت و “أليكسا” من أمازون وغوغل “ناو”، وأحدثها “بيكسبي” من سامسونغ، حيث أصبح الخادم الشخصي الحاسوبي جزءاً لا يتجزأ – في الغرب على الأقل – من الحياة اليومية بفضل دعم الشركات لهذه التطبيقات بشكل قوي و مباشر، في محاولة لجعلها طرقاً سريعة للقيام بالمهمات عند عدم توفـر اليدين للكتابــة، أثناء القيــادة مثلاً، وهذه التقنية التي دشنـت في 2011 من قبل أبـل، كانت السبــب في عودة الأبحــاث بشكـل مكثَّف إلى هذا المجال.
ما حدث خلال هذه العقود الستة من تطور تقني، كان كافياً لدفع عجلة الأبحاث للأمام مرة أخرى. فبعد قيام أبل بتدشين خادمها الشخصي “سيري”، تأكدت القدرة الكافية لصناعة معالجات حاسوبية متقدِّمة للقيام بعمليات بالغة التعقيد في أجزاء من الثانية، وتوفير مساحات تخزين ضخمة للبيانات بتكلفة رخيصة جداً، بالإضافة إلى توسّع نطاق حزم البيانات في الشبكة العنكبوتية، ما يكفي للسماح لهذا الكم من البيانات بالتنقل بين الخوادم والمستهلكين. وكل هذه الإمكانيات مكّنت الخبراء من استحداث تقنية جديدة تساعد الحواسيب على التعلّم العميق المبني على الخبرة التراكمية والقياس والتعلم من الخطأ عبر شبكات تعلم ذكية تسمى (Digital Neural Networks). وهذه الشبكات هي السبب الرئيس في النقلة النوعية لهذه التقنية لتدخل الحيز الاستهلاكي المستخدم اليوم، التي تعتمد بشكل مباشر على الإفادة من التوريد الجماعي (Crowd Sourcing) لنتائج بحث ملايين المستخدمين و الاستفادة من الكم الهائل من البيانات المستهلكة والمشتركة بينهم، التي يتم تحليلها بُعيد جعلها عديمة الهوية. الشيء الذي يجعل كثيرين يرفعون حواجبهم في تساؤل عن مدى احترام خصوصية المستخدم.
العقدة أمام المنشار
الغوص داخل أعماق هذه التقنيات حقيقة يكشف لنا مدى التباين بين بني البشر وأجهزة الحاسب الآلي، وهذه النقطة بالذات هي سبب تحيّر العلماء. وقد تكون هي العقدة أمام المنشار التي تعوق تطور الأبحاث بالسرعة التي توقعها الأسبقون في العقود الماضية، حين واجه العلماء عديداً من الصعوبات في محاولاتهم لجعل لغة بشرية ما – ولنفترض أنها الإنجليزية – تعتمد على عدد من القوانين الرياضية التي يمكن للحواسيب فهمها، وتكوين الجمل والردود و تخمين المطلوب من الجملة، أو حتى ترجمتها إلى لغة أخرى. لكن اللغات البشرية عضوية (organic)وتحتاج إلى منطق بشري لفهمها، بعكس لغات الحواسيب الرياضية والتي لا تفسير لها إلى كما هي. فكلمة مثل (Express ) تعتمد بشكل كبير على سياق الجملة لتفهم المعنى المقصود، والذي قد يكون (سريع) أو (يعبّر) ، والتي نرى هنا أن أحدها هو وصف والثاني فعل. ولا تستطيع الحواسيب معرفة الفرق بين الاثنين منطقياً، فتلجأ الحواسيب للاتكاء على مليارات النصوص المكتوبة والمنطوقة في أثير الشبكة، وتقارن بين جميع الحالات التي استخدمت فيها الكلمة بحالتيها، لتصل إلى المعنى المطلوب، وتكتشف فرق السياق بين الاثنين وبالتالي تجيب الإجابة الصحيحــة. كما أن الكلمات التي تنطــق بشكل متشابـه تماماً ولكن تكتب بإملاء مختلف (Meat, Meet) تجعل الترجمة الفورية للجمل المنطوقة صعبة جداً على أجهزة تفتقد العاطفة والذكاء اللازمين لفهم البلاغة و المعنى والتوجّه النحوي للجملة.
لا صديق إلكتروني قريباً
هذا التعقيد اللغوي الذي يفككه العقل البشري بأقل مجهود، يستهلك عديداً من الموارد الحاسوبية للقيام به. وعلى الرغم من التقدم الهائل الذي تحرزه الأجهزة بشكل يومي، لا تزال هذه الأجهزة “متخلفة” إلى حد ما. ويقول أحد الخبراء: “يفتقر كثير من البشر إلى أبسط مبادئ المنطق، وبرمجة ذلك في لغات حوسبة ليست سهلة على الإطلاق” فإذا سألت “سيري” مثلاً سؤالاً وأعقبته بسؤال مكنون بضمائر تابعة للسؤال الماضي، سيقف التطبيق حائراً ولا يعلم الإجابة. لأنه يفتقد العضوية الإنسانية التي تربط الأفكار ببعضها. وهذا ما يجعل الحلم بأن يكون للإنسان رفيقاً إلكترونياً يغنيه عن بني البشر أمراً من ضروب الخيال في الفترة الحالية.
وعلى صعيد آخر، فكل ما سبق لا يزيد إلا تعقيداً مع لغة الضاد، التي عرف عنها تعقيدها البلاغي. وعلى الرغم من التقدم الملحوظ في الترجمة الإلكترونية من العربية وإليها، أصبحت أخطاء هذه الترجمات فادحة ما يكفي لتكون فكاهة هذا العصر، وتتناقل بشكل يومي كنوع من الدعابة. وهذا ما يجعل اللغة العربية إحدى اللغات التي ما زالت تضطر مقدمي الخدمات إلى الاستعانة بالعامل البشري للتنقيح والتصحيح، وتفادي الأخطاء الصغيرة منها والفادحة. وهذا بالطبع يزيد من تكلفة استخدام هذه اللغة بشكل استهلاكي. بينما يرى العلماء أن تدخّل البشر في ترجمة اللغات الأخرى مستقبلاً سيكون إشرافياً فقط ولرفع مستوى جودة الترجمة لا أكثر، حيث ستكون الترجمة الفورية من الحواسيب دقيقة ما يكفي لتفادي الأخطاء البديهية الحالية.
وبالمقابل تشهد الترجمة الفورية المنطوقة بين اللغات تقدماً ملموساً، وأصبحت واقعاً تجريبياً يتحسن مع كل استخدام، ليصبح التطور شخصياً لكل مستخدم على حدة. ونذكر منها جهاز “المرشد” الواعد للترجمة الفورية وإن كان يعتمد على هاتفك الذكي الموصول بالإنترنت، ويليه جهاز “ايلي” الياباني الذي يمكن تعليقه حول الرقبة.
فآفاق المستقبل مبشّرة ، لكنها تظل أبطأ مما توقعه أسلافنا من العام 2000. ولعل التفوق في الترجمة الفورية يقربنا أكثر إلى بعضنا عبر إتاحة المجال للاطلاع على العلوم والمعارف المختلفة بسهولة، ويقلل من سوء الفهم الذي هو نواة كثير من المشكلات والصراعات.