07-يناير-2024
استخدام الذكاء الاصطناعي بتحويل الصوت إلى نص

إمكانية استخدام الذكاء الاصطناعي بتحويل الصوت إلى نص

أصبح من الممكن استخدام الذكاء الاصطناعي بتحويل أي صوت إلى نص أو العكس، بل هناك مواقع تقدم خدمة إنشاء نص وفق الذكاء الاصطناعي من ثم إلقاؤه، مع إتاحة خواص جديدة، مثل اختيار الشخصية واللغة وحتى اللهجة لمقدم النص.

كيفية تحويل أي صوت إلى نص بالذكاء الاصطناعي

تختلف الاستخدامات والخواص بين موقع وآخر يقدم ذات الخدمة حسب ما تفضّله، فهل تريد استخدام موقع أو برنامج بهدف الترجمة الفورية للصوتيات إلى نصوص، أم لديك ملف صوتي وتريد أن يتحول إلى ملف مكتوب، أم تريد فقط الكتابة الصوتية عبر استخدام الميكرفون في جهازك؟

الأمر بات أسهل مما سبق، كل ما عليك أن تفعّل خاصية أو ترفق ملفك الصوتي لموقع يعمل وفق الذكاء الاصطناعي، لتحصل على النسخة من الملف المكتوب خلال ثوانٍ.

نشارك معكم مواقع إلكترونية تعتمد استخدام الذكاء الاصطناعي بتحويل أي صوت إلى نص، فضلًا عن إضافة خدمات أخرى سنأتي على ذكرها وفق ما يلي:

  1. تحويل الصوت إلى نص عبر مايكروسوفت

ومن الملاحظ أن العديد من الشركات الكبرى قد بدأت بدعم خاصة، مثل خاصية التفريغ الصوتي لمايكروسوفت، في إصداري 10 و 11 Windows، ويمكن استخدام خاصية تحويل أي صوت إلى نص بضغط خيار "علامة ويندوز + حرف الـ H" من ثم تضغط على زر الميكرفون للبدء بالكتابة الصوتية.

لكن استخدام الخدمة الحالية من مايكروسوفت لا تدعم اللغة العربية إضافة للغات عديدة، بينما من المتوقع أن تشمل العربية في المستقبل.

وتعد هذه الأداة بين الأدوات المساعدة في تحويل الصوت إلى نص مكتوب مجانًا، بينما تفرض مواقع أخرى اشتراكات مدفوعة لقاء استخدامها والتمتع بهذه المميزات.

  1. تحويل الصوت إلى نص أون لاين عبر موقع Rask AI

من الخيارات البديلة في استخدام الذكاء الاصطناعي من أجل تحويل أي صوت إلى نص عربي أو بأي لغة أخرى، موقع Rask AI للتفريغ الصوتي.

يدعم الموقع خيارات تحويل أي تسجيل صوتي أو مرئي إلى نص مكتوب مع خيارات إضافية، مثل إنشاء ملفات الترجمة لمقاطع الفيديو، كما يُستخدم الموقع من أجل تحويل المحاضرات الصوتية وغيرها إلى نص مكتوب.

ويدعم الموقع أكثر من 130 لغة منها اللغة العربية، أما بالنسبة لطريقة الاستخدام فهي سهلة للغاية مع إتاحة خاصية التجربة المجانية.

  1. تحويل الصوت إلى نص عبر موقع SpeechText.AI

إن موقع SpeechText.AI للتفريغ الصوتي والتعرف على الكلام وتحديد المتحدثين ومن ثم تحويل الملف تلقائيًا إلى نص من المواقع الشائعة الاستخدام أيضا.

يدعم الموقع أكثر من 30 لغة ولهجة كما يتفرد ببعض الخواص، مثل تحديد المتحدثين وإتاحة واجهة بهدف تدقيق المحتوى المكتوب مع العناية بعلامات الترقيم.

ويتيح الموقع تجربة مجانية محدودة للمستخدمين مثل بقية المواقع الأخرى، بينما تبدأ خطط الأسعار من 10 دولار وتُقاس على أساس حجم الملفات.

  1. تحويل أي صوت إلى نص عبر أداة Transkriptor

تتميز أداة Transkriptor للتفريغ الصوتي، بأنها تتيح خدمة الربط مع تطبيقات الاجتماعات الشهيرة مثل مواقع وتطبيقات "zoom – google meet – Microsoft teams" من ثم يتم تشغيل روبوت الذكاء الاصطناعي حتى يبدأ بتلخيص الاجتماع وتوفير نسخة مكتوبة منه للمستخدم.

على سبيل المثال، مع استخدام هذه الأداة إضافة إلى المساعد الذكي بجوجل، سيحضر اجتماعاتك الذكاء الاصطناعي نيابة عنك، من ثم يقدم لك موجزا عن الاجتماع، بينما ستساعدك أداة Transkriptor بالتفريغ الصوتي.

يؤخذ عليه بعد تجربة قصيرة أنه غير دقيق كفاية في إرفاق النصوص المكتوبة للاجتماعات، لكن من بين الملاحظات التي يشير إليها مطورو الأداة "أن تكون لغتك المستهدفة صحيحة وواضحة" أي بمعنى أن المستخدم يجب أن يتحدث بلغة تدعمها الأداة.

  1. تحويل الصوت إلى نص عبر موقع Moises

إن استخدام الذكاء الاصطناعي بتحويل الصوت إلى النص لا ينحصر بأداة أو اثنتين، بل هناك عشرات الخيارات البديلة، مثل موقع Moises للتفريغ الصوتي بتقنية الـ AI.

ويُلاحظ في الموقع أنه يتخصص أكثر في الأغاني والمقطوعات الموسيقية، حيث يقدم مزايا مثل:

  • إنشاء مسارات موسيقية وإزالة الصوت الغنائي منها.
  • تفريغ كلمات الأغاني كتابيا عبر الـ AI.
  • المساعدة في كتابة كلمات الأغاني عبر اقتراح أسطر وقوافٍ للكلام المكتوب.

ومن السهل استخدام الموقع، حيث يتطلب إضافة بريد إلكتروني وكلمة سر، من ثم البدء في استخدام الفترة التجريبية المجانية لاكتشاف الموقع.

من أهم مميزات استخدام الذكاء الاصطناعي بتحويل الصوت إلى نص اختصار الوقت، فتفريغ أي ملف صوت إلى نص يحتاج مدة دقيقة عبر استخدام مواقع الذكاء الاصطناعي، لكنه قد يحتاج إلى ساعة من العمل اليدوي.

 

مميزات وعيوب استخدام موقع الذكاء الاصطناعي لتحويل أي صوت إلى نص

يضيف استخدام مواقع وأدوات الذكاء الاصطناعي بهدف تحويل أي مقطع فيديو أو صوت إلى نص مكتوب العديد من المميزات، لكن في المقابل ما تزال هناك عيوب ينبغي الإشارة إليها.

ما هي المميزات؟

ووفق تجربة العديد من المواقع، نلاحظ ما يلي:

  • اختصار مزيد من الوقت، على سبيل المثال، تفريغ أي ملف صوت إلى نص لمدة دقيقة عبر استخدام مواقع الذكاء الاصطناعي، قد يحتاج إلى ساعة من العمل، بينما مع استخدام هذه المواقع، يتم إنجاز المهمة بثوانٍ.
  • القدرة على فصل أصوات المتحدثين إن كانت المكالمة جماعية.
  • اختصار المزيد من التكاليف، حيث إن الاشتراك في بعض المواقع أقل تكلفة من توظيف شخص يؤدي مهام "التفريغ الصوتي".
  • تلخيص الاجتماعات والمحاضرات مع إمكانية تحرير النصوص المستخلصة عبر أدوات الذكاء الاصطناعي.

ما هي العيوب؟

في المقابل، لا يخلو استخدام مواقع الذكاء الاصطناعي لتحويل أي صوت إلى نص من العيوب، فيما يلي، بعض مما لاحظناه:

  • أسعار بعض المواقع والأدوات مبالغ فيها، مثل موقع Rask AI حيث تبدأ التكلفة من 2 دولار أمريكي مقابل تفريغ دقيقة كاملة من استخدام مواقع الذكاء الاصطناعي لتحويل أي صوت إلى نص مكتوب، بينما هناك من يقوم بالمهمة مقابل أسعار تقل عن ذلك للدقيقة الواحدة.
  • عدم دقة بعض الأدوات في استخلاص النصوص المكتوبة، الأمر الذي يحتاج إلى مراجعة الصوتيات التي تم تفريغها من جديد.
  • ليست كل الأدوات والمواقع تدعم اللهجات المحلية، وهي الأكثر استخدامًا في الاجتماعات والمحاضرات وجلسات العمل المرئية والصوتية.
  • لا تدعم جميع المواقع والأدوات اللغة العربية، الأمر الذي يجعل استخدامها مقتصرًا على لغات أخرى.

 

ما الذي يمكن فعله عند استخدام مواقع الذكاء الاصطناعي لتحويل صوت إلى نص؟

على الرغم من سلبيات استخدام مواقع الذكاء الاصطناعي لتحويل الصوت إلى نص مكتوب، لكن اتباع إرشادات معينة من شأنه أن يحسّن من شكل المحتوى المكتوب.

فيما يلي بعض الإرشادات عند استخدام هذه المواقع:

  • يجب التحدث بصوت واضح وبلغة يفهمها الموقع المستخدم للحصول على نص مطابق تقريبًا للأصوات.
  • من المهم الابتعاد عن الضوضاء واختيار أماكن هادئة للحديث، كي لا تتداخل الأصوات الجانبية مع صوت المتحدث مما يؤثر على أداء التفريغ الصوتي.
  • استخدام علامات الترقيم خلال التحدث، مثل قول كلمة "نقطة" عند اختتام الجملة أو "فاصلة" عند انتهاء جملة والبدء بأخرى.
  • المراجعة السريعة للنص المستخرج من الصوت من أجل تجاوز أية عيوب وتنسيقه بشكل أفضل مثل حذف فقرة وإضافة أخرى.
  • فصل الملفات الصوتية إلى عدة أقسام في حال كان هناك أكثر من متحدث لسهولة تنسيق النصوص المكتوبة المستخلصة من التفريغ.

قد فتحت ميزة استخدام الذكاء الاصطناعي بتحويل الصوت إلى نص آفاقًا جديدة لصانعي المحتوى، في الوقت الذي يجري تطويرها مع مرور الوقت لتشمل المزيد من اللغات واللهجات، بينما باتت منصات عديدة تقدم الخدمة تلقائيًا، حيث يتم إرفاق نص مكتوب للحديث المحكي مع ميزة الترجمة للغات أخرى بشكل مباشر، مثل سناب شات وتيك توك ويوتيوب وغيرها.