واجهة برمجة تطبيقات نصية الى كلام ، والبرامج الحديثة التي يستخدمها المستخدم في كل ما يفعله على هذه التطبيقات، ويعتمد استخدامها كليًا على الواجهات التي يتعامل معها، والواجهة الأكثر سلاسة وبساطة وسهولة، والفائدة الأكبر المستخدم وسهولة العمل والمرونة في الأداء، وكذلك الأمر مع واجهات تطبيقات تحويل النص إلى كلام، وفي مقالنا اليوم، سنجيب على هذا السؤال ونتعرف أكثر على ماهية تحويل النص إلى كلام .
تعريف تحويل النص إلى كلام
تحويل النص إلى كلام، المعروف أيضًا باسم تركيب الكلام، هو عملية تحويل النص المكتوب إلى صوت منطوق، وفي معظم الحالات، يشير تحويل النص إلى كلام إلى نص على جهاز كمبيوتر أو جهاز آخر، وهذه الميزة تنشئ بيانات صوتية أولية لخطاب الإنسان الطبيعي، أي أنه يُنشئ صوتًا يبدو وكأن الشخص يتحدث، وتحتوي هذه الميزة أيضًا على مجموعة واسعة من الأصوات المخصصة المتاحة للاستخدام، وتختلف الأصوات حسب اللغة والجنس واللهجة، إلى جانب الصوت، يمكن للمستخدم أيضًا تكوين جوانب أخرى من إخراج البيانات الصوتية الناتجة عن توليف الكلام، وهو يدعم تحويل النص إلى كلام وتكوين معدل التحدث والنغمة والحجم ومعدل عينة هرتز.
واجهة برمجة تطبيقات نصية الى كلام
حاليًا، يعد تحويل النص إلى كلام أمرًا مهمًا وسهلاً للغاية، وما يجعله سهلاً هو استخدام واجهات تطبيق سلسلة، ويتم تعريف هذه الواجهات على النحو التالي
- الواجهات التي توفر واجهة برمجة تطبيقات تحويل النص إلى كلام يتم عرضها عن طريق تشفير النص باستخدام SSML و JSON وما إلى ذلك،
باستخدام SSML، يمكن للمستخدم إدخال فترات توقف أو اختصارات أو تفاصيل إضافية أخرى في البيانات الصوتية التي تم إنشاؤها بواسطة واجهة برمجة تطبيقات تحويل النص إلى كلام، يدعم تحويل النص إلى كلام مجموعة فرعية من عناصر SSML المتاحة، والتي توفر ميزات مهمة، مثل التأكد من أن بناء الجملة يلفظ الأرقام الترتيبية بشكل صحيح.
ألية عمل واجهة برمجة تطبيقات تحويل النص إلى كلام
تبدأ العملية عندما يرسل البرنامج نصًا إلى واجهة برمجة التطبيقات كطلب، والذي يتم إرساله عادةً في أكثر من تنسيق واحد، مثل JSON، ولكن غالبًا ما يستخدم SSML، وهو نوع من لغة الترميز التي تم إنشاؤها لتحسين كفاءة تركيب الكلام البرامج، بمجرد أن تتلقى واجهة برمجة التطبيقات الطلب، ستعيد الكائن الصوتي المكافئ، ويمكن بعد ذلك دمج هذا الكائن في البرنامج الذي قدم الطلب، والذي يقوم أيضًا بتشغيله للمستخدم، كما تسمح أفضل واجهات برمجة تطبيقات TTS باختيار اللهجة والجنس، على سبيل المثال يمكن اختيار اللغة الإنجليزية بلكنة أسترالية، ويمكن أيضًا اختيار نوع الصوت هو الجنس، على سبيل المثال، يمكنك اختيار صوت امرأة عجوز أو شابة.