Gemini حوّل بحثي المُعقد إلى بودكاست: لن أعاني أبدًا مرة أخرى

0

انتقال من مساعد Google إلى عصر Gemini، تقريبًا في مراحله الأخيرة. قد يشعر المرء بالحنين إلى المساعد الافتراضي ذي الاسم نفسه، لكن لا يمكن إنكار أن وصول Gemini قد غير حقًا ما يمكن أن يفعله وكيل الذكاء الاصطناعي من أجلنا.

إن مهارات فهم اللغة أفضل بكثير مع Gemini. المحادثات طبيعية، وتفاعلات التطبيق سلسة، والتكامل مع منتجات Google الأخرى مجزٍ، وحتى في حالته المجانية، Gemini يتفوق على Siri حتى على iPhone.

ومع ذلك، هناك بعض الحيل التي تضع Gemini في فئة مختلفة تمامًا. Deep Research هي إحدى هذه الميزات الوكيلة التي أستخدمها يوميًا وأستمر في الشعور بالدهشة منها. في مارس، أضافت Google ميزة مجزية أخرى إلى ترسانة Gemini: Audio Overviews.

تحويل كل شيء إلى بودكاست

Audio overview prompt in Gemini.

تخيل تحويل وثائقك المملة، أو ورقة بحثية معقدة للغاية، أو مواد قراءة أكاديمية إلى محادثة بودكاست ثنائية حيوية. هذا هو جوهر ميزة “الموجزات الصوتية”. ظهرت الميزة لأول مرة على NotebookLM من Google، والذي تم التقليل من شأنه بشكل كبير، وتم نقلها أخيرًا إلى تجربة Gemini الأساسية على الهاتف المحمول والويب.

لا داعي للخوض في أي إجراءات تقنية، أو كتابة موجه نصي محدد للغاية للحصول على هذه التعديلات الصوتية. ما عليك سوى تحميل ملف من مُختار المرفقات، وستظهر شريحة “إنشاء موجز صوتي” أعلى مربع الدردشة مباشرةً. انقر عليها، وسيبدأ إنشاء البودكاست.

قد يستغرق الأمر بضع دقائق لإكماله، ولكن في هذه الأثناء، يمكنك التبديل بأمان إلى تطبيق (أو نافذة) آخر. بمجرد انتهاء العملية، ستتلقى إشعارًا حول استعداد البودكاست للاستماع إليه، أو مشاركته مع أشخاص آخرين.

عادةً ما يكون المراجع الصوتي عبارة عن محادثة ثنائية، متدفقة بحرية، بنبرة طبيعية غريبة. يبدو الأمر كما لو كنت تتحدث مع Gemini Live، والذي يبدو نفسه أكثر طبيعية بشكل كبير من أي روبوت محادثة ذكي استخدمته حتى الآن في وضع المحادثة الصوتية.

أود أن أقول إن هذه البودكاستات التي تم إنشاؤها بواسطة الذكاء الاصطناعي مصنوعة بشكل جيد للغاية. لكنني أنجذب إليها لعدة أسباب. أولاً، أقضي معظم اليوم في التحديق في شاشة، وقراءة المقالات للبحث، وكتابة أشيائي الخاصة.

Gemini podcast creation in process.

لا يترك ذلك مجالًا كبيرًا للتفاعل مع أي مواد نصية أخرى، سواء كانت أكاديمية أو متعلقة بالعمل أو حتى ترفيهية. ومع ذلك، إذا استطعت فقط تغيير الوضع الحسي للتفاعل مع تلك المواد، فإن إرهاق القراءة سيتراجع.

تقدم بودكاست الصوتية طريقة جديدة تمامًا للتفاعل مع المواد النصية بطريقة أكثر غامرة. وهذا يوصلنا إلى الميزة الثانية، وهي التحفيز الحسي، أو التباين. تم توثيق هذه الصيغة وتجربتها جيدًا في مجال الأكاديمية والتدريب المهني.

كيف ساعدني؟

يؤثر إرهاق القراءة على قدرتك على التركيز. يجعل حتى العمل المثير يبدو وكأنه واجب عليك إنجازه، فقط لأنك لا تستطيع تحمل تفويته. ومع ذلك، فإن التفاعل مع نفس العمل، أو جوهره، من خلال وسيلة حسية مختلفة يقلل من هذا الخوف من التحميل الزائد بالمادة النصية. في الواقع، يساعد ذلك في بعض الطرق الأخرى.

يقول ياسر نسيم، خبير في اللغويات، ركزت أبحاثه على تحديث وتطوير أساليب التدريس: “إن إشراك حواس متعددة يقوي الذاكرة. عندما نستمع ونُشارك – سواء من خلال القراءة أو الكتابة أو الفعل – يبني الدماغ روابط أقوى، مما يسهل التذكر لاحقًا”.

يخبرني نسيم، الذي يعمل حاليًا خبيرًا في المناهج الدراسية في شركة رائدة في مجال التعليم عبر الإنترنت، أنه لا يمكنك الاعتماد على وسيلة واحدة فقط للتعلم. بدلاً من ذلك، يخبرني، تحتاج إلى دمج طرق مختلفة لتحقيق أقصى فائدة، بدءًا من التأثير العاطفي إلى الاحتفاظ بالذاكرة.

Gemini creating audio overview.

أبرزت الأبحاث المنشورة في مجلة Computers & Education أيضًا كيف وجد الطلاب أن ملفات الصوت هي مادة التعلم والمراجعة الأفضل. لعبت المرونة والتنوع الحسي دورًا رئيسيًا في تفضيلهم للبودكاست على الوسائط الأخرى.

يضيف نسيم: “التفهم الحقيقي والاحتفاظ على المدى الطويل يحدث عندما يقترن الاستماع بالصور أو المناقشات أو الأنشطة العملية”. تتفق تجاربي الخاصة مع ملخصات الصوت من Gemini مع نصيحته. لديّ ذاكرة أقوى للمعرفة التي امتصصتها من خلال بودكاست الصوت مقارنة بقراءة نفس المادة.

ترى، هذه البودكاست الصوتية ليست تحويلًا بسيطًا من النص إلى الصوت. بدلاً من ذلك، تُفكك جدارًا نصيًا مملًا إلى محادثة بين شخصين، أنت في الأساس الجمهور الوحيد لها. إنه نعمة لأي مادة نصية لا تُثير فضولك على الفور وتُشجعك على القراءة الفورية.

في تجربتي الأخيرة، ساعدني بودكاست الصوت من Gemini على فهم أهمية ورقة بحثية تناقش “إطارًا للتعلم العصبي القابل للتفسير بناءً على وظائف الهدف المحلية القائمة على المعلومات”. بعبارات أبسط، ناقشت الدراسة كيفية تنظيم الخلايا العصبية نفسها.

فهمت ما أحاول قوله هنا، أليس كذلك؟

الراحة فوق كل شيء

Gemini AI creating audio podcast out of research paper.

تلعب الراحة دورًا مهمًا عندما يتعلق الأمر بامتصاص المعلومات. وكذلك الحماس والإثارة بشأن العملية بأكملها. وفقًا لورقة بحثية نشرت في مجلة Computers in Human Behavior، فإن البودكاست “تعزز الراحة والمرونة وإمكانية الوصول إلى المعلومات والمعرفة”. لم يستغرق الأمر مني وقتًا طويلاً لأدرك ذلك.

العيش في العاصمة الوطنية، وقضاء ما بين 2-3 ساعات عالقًا في حركة المرور أو وسائل النقل العام هو واقع يومي بالنسبة لي. لكن أكثر من الشعور بعدم الراحة، هو الوقت الضائع الذي يؤلمني أكثر. توفر مواد التعلم الصوتية الطريقة الأكثر ملاءمة لاستخدام هذا الوقت بطريقة منتجة.

مع Gemini، لديك فائدة حاسمة أخرى. لا داعي للاعتماد على توفر الصوت لكتاب معين أو مقال إخباري أو مادة أكاديمية. يمكنك فقط تنزيل أي مادة متاحة لك، وستقوم Gemini بتحويلها إلى محادثة على شكل بودكاست.

هناك الكثير من الأبحاث متعددة التخصصات التي تدعم فوائد النهج القائم على الصوت للتعلم. وليس الأمر يتعلق فقط بالاستماع، بل أكثر من ذلك بكثير عن تفكيك الأشياء وعرضها بطريقة أكثر سهولة.

يقول باحثون نقلاً عن محرر أخبار: “قال بعض الأشخاص … إنهم يحبون حقيقة أننا نقدم لهم بعض الأشياء التي لا يقرؤونها في الصحيفة. إنهم يحبون حقيقة … أننا نحاول تقديم أنفسنا بطريقة مختلفة”. نشرت الورقة البحثية، من قبل جامعة سيراكيوز، في عام 2006 خلال الأيام الأولى جدًا لاتجاه البودكاست.

Generating audio overview podcast in Gemini.

اعتبارًا من عام 2025، أصبحت البودكاست ظاهرة حقيقية لاستهلاك المعلومات، من المواد التعليمية إلى الترفيه. وفقًا لـ Pew Research Center، شارك ما يقرب من نصف الأمريكيين في البودكاست. استمع أكثر من نصف الجمهور المستطلع للبودكاست للتعلم أو للترفيه أو للحصول على بعض المواد الصوتية أثناء القيام بشيء آخر.

أراد ما يقرب من ثلثهم سماع آراء الآخرين، وكان قطاع آخر كبير متصلًا حتى يتمكنوا من مراقبة الأخبار والأحداث الجارية. لم يكن مشاركتي بعيدة جدًا عن النمط المذكور أعلاه. بالنسبة لقصة الصحافة الطويلة أو العمل الاستقصائي، غالبًا ما وجدت نسخة البودكاست الخاصة بهم أكثر إرضاءً.

أكثر فعالية أيضا

من المثير للاهتمام أن البودكاست يبدو أنه يدفع إلى حدوث تغييرات عملية أيضًا. فقد تفاعل حوالي ثلثي المستمعين مع كتاب أو فيلم بعد سماع بودكاست، وأكثر من نصف الجمهور بدأوا بمتابعة شخص ما على وسائل التواصل الاجتماعي، وثلثهم قاموا بتغييرات في نمط حياتهم مثل ممارسة الرياضة أو تغيير نظامهم الغذائي.

أبرزت الأبحاث المنشورة في مجلة التسويق عبر وسائل التواصل الاجتماعي مفاهيم مثل استبدال الوسائط والتشابه الوظيفي في سياق الاستماع إلى الوسائط واستعداد الجمهور. الفكرة الرئيسية هي أن المستخدمين يقيّمون الوسائط ويختارون الوسائط التي تناسبهم أكثر.

يقول البحث: “بالنسبة لخصوصية محتوى البودكاست، فإن التأثير على استعداد الاستماع واستبدال الوسائط إيجابي، مما يشير إلى أن المحتوى الفريد، والجودة العالية، والتنوع الواسع يجعل الناس يرغبون في الاستماع إلى البودكاست”. وأنا شخصياً أؤكد على صحة هذه النتيجة أيضًا.

خلال الأيام القليلة الماضية، قمت “بتحويل” العديد من أوراق البحث التي تناقش تأثير استهلاك الألياف واللحوم والأطعمة المعبأة على أنماط النوم والصحة الإدراكية وصحة الأمعاء إلى شكل بودكاست. مقارنةً بالنبرة الفنية الواضحة في الأوراق العلمية، فإن وجود مضيفين اثنين يشرحان النتائج بنبرة “عاطفية” و”مقنعة” كان له تأثير أعمق بشكل ملحوظ عليّ.

فكر في الأمر كتعلم آداب السلوك الاجتماعي أو الحساسيات الثقافية من كتاب. وبعد سنوات، ترى هذه الأشياء في الواقع بعينيك. أو فكر في تعلم لغة أجنبية من كتاب، بمفردك، والفرق الذي يحدثه عندما تتعلمه من شخص يملأ أذنيك بكل تلك المعرفة.

الطريقة الأخيرة تحقق نتائج أفضل. وهذا يرجع بشكل أساسي إلى أن التأثير المركب للمشاركة الحسية المتعددة يسرع عملية التعلم، أو يجعلها أكثر فعالية. لقد حققت Audio Overviews من Gemini تأثيرًا مشابهًا، وساعدتني كثيرًا.

بعض العقبات

على الرغم من كونها منتجة كما تبدو، فإن ميزة “النظرة العامة الصوتية” في Gemini ليست مثالية. يمكن أن تُفقد جوهر القصة المكتوبة بشكل جميل في محاولاتها “تحويلها إلى بودكاست”، أو تفوّت بعض التفاصيل الصغيرة. هناك أيضًا بعض الغرائب الوظيفية. يمكن أن يكون طول النظرة العامة الصوتية، والذي يتناسب بشكل مباشر مع عمق المادة المصدر، عشوائيًا تمامًا.

على سبيل المثال، عندما قمت بتغذية Gemini بكتاب من 260 صفحة عن موضوع تصريف الأفعال ومورفولوجيا الأفعال في اللغة الفارسية، كانت النظرة العامة الصوتية التي تم إنشاؤها بواسطة Gemini تزيد قليلاً عن سبع دقائق. من الناحية النوعية، غطت الأجزاء الأكثر أهمية، لكنها فاتتها التفاصيل الدقيقة.

في حالة أخرى، حولت وثيقة بحث عميق بقيمة أربع صفحات إلى بودكاست صوتي. كانت مدة هذا البودكاست حوالي 13 دقيقة. لسوء الحظ، لن تسمح لك رقاقة المهام التلقائية في Gemini بتعديل الطول أو عمق المحادثة في النظرة العامة الصوتية.

إذا كنت تستخدم Google NotebookLM، حيث ظهرت ميزة النظرة العامة الصوتية لأول مرة، فيمكنك كتابة موجه يمكنه تحديد مدى عمق محادثة البودكاست. لقد أنشأت بودكاست صوتيًا مع وقت تشغيل 59 دقيقة على NotebookLM قبل بضعة أسابيع.

لن يسمح لك Gemini بذلك. ليس بعد.

ثم، لدينا حاجز اللغة، حيث تعمل Google حاليًا على تحسين خط الأنابيب بأكمله خارج اللغة الإنجليزية. كانت مشكلة أخرى هي النطق المأخوذ من اللغة الإنجليزية. على سبيل المثال، أخطأ مضيف البودكاست AI في نطق كلمة “Raf-thin” الفارسية كـ “Raaf-tin”.

بالنسبة للأذن غير المدربة غير المألوفة بالفروق اللغوية ثنائية اللغة بين الترجمة الإنجليزية والفارسية، أو كيف تؤثر اللهجات على الإدراك السمعي للكلمات بلغة مختلفة، يمكن أن يكون مضيفو البودكاست AI ينثرون هراءًا تامًا.

إن مجموع تجاربي هو أن “النظرات العامة الصوتية” في Gemini ليست ثورة. إنها تقدم فقط وسيلة مختلفة وأكثر إشراكًا للتفاعل مع المحتوى. لا تعمل طوال الوقت، لكنها بالتأكيد تخفف من ملل قراءة صفحات من النصوص التي من شأنها أن تُسقطك في النوم.

اترك رد

لن يتم نشر عنوان بريدك الإلكتروني.