دسترسی به دنیای مجازی، حق مسلم نابینایان است.

همیشه جای خالی چنین بلاگی را در خانواده ی بلاگهای فارسی خالی می دیدم. امیدوارم این بلاگ سرآغاز کوششی باشد از سوی نابینایان برای رفع تفاوتهای فاحش که در دسترسی این افراد به دنیای مجازی و اینترنت وجود دارد. با تشکر، علی اصغر اسدی، مدیر و نویسنده ی بلاگ.

۱۳۸۸ بهمن ۱۴, چهارشنبه

کمی بیشتر در مورد TTS و شرکتهای تولید کننده ی آن بدانیم:

در مقالات پیشین، بارها به کلمه ی TTS اشاره کردیم و گفتیم که تمام نرم افزارهای صفحه خوان دست کم از یک TTS بهره می برند که امکان خواندن متون را به نرم افزار صفحه خوان می دهد.
امروزه می توان این نرم افزارها را در دو گروه تقسیم بندی کرد:
برخی از آنها دارای صدای طبیعی هستند و با صدای زنانه یا مردانه صحبت می کنند.
در این گونه از TTS ها واجهای زبانی که TTS برای آن طراحی شده با صدای انسان ضبط می شود و نرم افزار با استفاده از بانک اطلاعاتی خود آنها را در کنار یکدیگر قرار می دهد و بدین ترتیب، کلمات و جملات مختلف تولید می شود.
در نوع دوم واجها که کوچکترین واحد زبانی در هر زبان محسوب می شود توسط کامپیوتر تولید می شود و در نتیجه صدای انسانی تولید نمی شود ولی از آنجا که فایلهای صوتی ضبط نشده اند و حجم نرم افزار نسبت به گروه اول کمتر است، سرعت نرم افزار بیشتر است.
این عامل مستقیماً در سرعت خواندن متون توسط نرم افزار صفحه خوان برای افراد نابینا تأثیر می گذارد.
به همین دلیل است که طراحان نرم افزارهای صفحه خوان در نرم افزارهای خود از یک TTS از نوع اول استفاده می کنند که سرعت و حجم نرم افزار صفحه خوان را کاهش می دهد.
TTS های نوع دوم که صدای انسانی دارند، بیشتر برای خواندن کتب و یا تبدیل متون مختلف به فایل های صوتی مورد استفاده واقع می شوند.
رایج ترین نرم افزار TTS که در صفحه خوان ها از آن استفاده شده و می شود، Eloquence نام دارد که توسط شرکتی به همین نام تولید شد که بعدها این شرکت با شرکت Nuance ادغام شد.
گرچه این صدا صدایی انسانی نیست، قابلیت های منحصر بفرد آن از نظر شیوایی صدا، سرعت بالا و طراحی آن در زبان های مختلف، آن را به محبوبترین و شناخته شده ترین نرم افزار TTS چه برای نابینایان و چه برای شرکت های تولید کننده ی نرم افزارهای صفحه خوان تبدیل کرده است.
در حال حاضر، این TTS قادر است متون مختلف را به زبان های انگلیسی، آلمانی، فرانسوی، فنلاندی، اسپانیایی و پرتغالی بخواند.
این نرم افزار با قابلیت تغییر سرعت خواندن متون و نیز تغییر زیر و بمی صدا به کارآمدی نرم افزارهای صفحه خوانی که از آن بهره می برند نیز افزوده است.
اغلب نرم افزارهای TTS تحت استاندارد SAPI4 یا SAPI5 هستند که این استانداردها از سوی شرکت مایکروسافت برای TTS هایی که می خواهند تحت سیستم عامل ویندوز کار کنند طراحی شده اند.
SAPI5 در سال 2000 به بازار نرم افزارها معرفی شد. این کلمه مخفف Speech Application Programming Interface است.

در اینجا قصد داریم به معرفی برخی از شرکتهایی بپردازیم که به تولید TTS دست زده اند.
Loquendo:
این شرکت در ایتالیا واقع است و جدیدترین نسل TTS ها را ساخته است که علاوه بر صدای انسانی که این نرم افزارها تولید می کنند، می توانند با قابلیت های منحصر بفرد خود متونی را که ترکیبی از انگلیسی با زبانی دیگر است را هم به خوبی بخوانند. علاوه بر این، TTS های ساخت این شرکت، با ضبط فایل های صوتی مختلف در نرم افزار که احساسات مختلف مانند گریه، خنده، تعجب، خستگی و غیره را نشان می دهند، تحولی نوین در بازار این نرم افزارها به وجود آورده اند.
در حال حاضر محصولات این شرکت پرطرفدارترین نوع TTS در بازار است که برای تولید آگهی های تبلیغاتی و پیام های روزانه و تجاری توسط شرکت های مختلف یا آژانس های هوایی و فرودگاه ها به کار می رود.
این شرکت بطور روز افزونی در حال گسترش زبانهایی است که برای آنها نرم افزار TTS تولید می کند.
آخرین اخبار حاکی از آن است که در سال 2010 این شرکت قصد تولید TTS برای زبان عربی را دارد.
با مراجعه به وب سایت این شرکت می توانید به نمونه هایی برای دانلود صداهای تولید شده توسط این شرکت دسترسی یابید.
برای اطلاعات بیشتر به آدرس های زیر مراجعه فرمایید:

Acapela TTS Group:
این شرکت نیز در اروپا واقع است و در حال حاضر برای 25 زبان TTS تولید کرده است که شامل صداهای زنانه و مردانه ی مختلف می باشد.
برای اطلاعات بیشتر به وب سایت این شرکت سر بزنید:

Cepstral:
این شرکت نیز برای تعدادی از زبان ها به تولید نرم افزار TTS دست زده است ولی جزء شرکت های پرطرفدار محسوب نمی شود.
نکته ی جالب در محصولات این شرکت، تولید TTS هایی است که با توجه به حالت ادای کلمات، برای تولید متون نمایشی مناسب هستند.
مثلاً یکی از تولیدات این شرکت، نرم افزاری است که متون انگلیسی را با صدایی عصبانی و همراه با فریاد قرائت می کند.
برای دانلود نمونه هایی از تولیدات این شرکت، به آدرس
سر بزنید.

AT&T Labs Natural Voices:
این شرکت محصولات خوبی ارائه کرده است و در حال حاضر، 17 TTS را برای زبان های انگلیسی، آلمانی، فرانسوی و ایتالیایی تولید کرده است.
برای دانلود برخی از نمونه های صداهای این شرکت به آدرس زیر بروید:

Nuance:
در مورد محصولات این شرکت در بخش های پیشین، توضیحات مفصلی ارائه شد. شاید بتوان گفت این شرکت بیشترین تعداد TTS در بین شرکت هایی که به این امر مشغولند را تولید کرده است و شرکت مایکروسافت در ویندوز از محصولات این شرکت استفاده کرده است.
این شرکت به تولید هر دو نوع TTS پرداخته است. یعنی، هم صداهای طبیعی انسانی و هم صداهای مصنوعی.
با مراجعه به وب سایت این شرکت می توانید در مورد تمام محصولات این شرکت، اطلاعات مورد نیازتان را کسب کنید.

Neospeech:
این شرکت آمریکایی نیز یکی از شناخته شده ترین تولید کنندگان TTS است و نرم افزارهای این شرکت می توانند متون مختلف را به زبان های انگلیسی، ژاپنی، کره ای و چینی برای کاربران خود بخوانند.
برای کسب اطلاعات بیشتر به وب سایت این شرکت سر بزنید:
توجه:
برای دانلود کردن نمونه های کاملی از صداهای شرکت های
Nuance
Acapela
 Neospeech
AT&amp
T Labs Natural Voices می توانید به آدرس زیر بروید:

The MBROLA PROJECT:
علاوه بر نمونه های بالا که جنبه ی تجاری دارند نمونه هایی نیز با کیفیت پایین تر به شکل رایگان برای همه گان بر روی اینترنت موجود است.
یکی از این دست نرم افزارهای TTS رایگان، MBROLA نام دارد که بانک اطلاعاتی آن توسط دانشگاهی در بلژیک طراحی شده است.
این پروژه می کوشد نمونه هایی از نرم افزار TTS را به صورت رایگان برای زبان های مختلف فراهم کند.
حتی چندین دانشجوی ایرانی در همکاری با این گروه و به عنوان پروژه ی پایان نامه ی خود مجموعه ی واجهای فارسی را ضبط کردند و کوشیدند یک نمونه ی ابتدایی از TTS را برای زبان فارسی پدید آورند.
این بانک اطلاعاتی بعدها مورد استفاده ی برخی از شرکتهای ایرانی قرار گرفت تا محصولات TTS خود را راهی بازار کنند که این تولیدات هم به دلیل کیفیت بانک اطلاعاتی این گروه دانشجویی و هم به خاطر پیچیدگی های این زبان دارای کیفیت مطلوبی نیست.
در حال حاضر دو شرکت پکتوس و هوش مصنوعی رایورز (با همکاری خانه ی نور جانبازان نابینای ایران) به تولید نرم افزار TTS فارسی دست زده اند که محصول شرکت پکتوس به نام پکجاز به هیچ وجه با استقبال و توجه نابینایان مواجه نشده است. شاید علاوه بر اشکال های این نرم افزار، دلیل این عدم استقبال را بتوان قیمت این نرم افزار دانست که حدود 500 هزار تومان می باشد.
کار مشترک شرکت هوش مصنوعی رایورز و خانه ی نور جانبازان نابینای ایران که پارسآوا نام دارد، اگرچه دارای اشکالات متعددی است ولی به دلیل قیمت ارزان و کارایی آن در محیط اینترنت و متون HTML مورد استقبال قرار گرفته است.
امید است که با استفاده از یک بانک اطلاعاتی بهتر، این گروه بتواند در نسخه های بعدی این نرم افزار، نقایص موجود را برطرف کند.
برای کسب اطلاعات در مورد MBROLA, به آدرس زیر سر بزنید:
برای کسب اطلاعات بیشتر در مورد پارسآوا و شنیدن نمونه ی صدای این نرم افزار به وب سایت
سر بزنید.

رفتن به بالاي صفحه

1 نظر:

Anonymous امیر سلامی گفت...

"از خواندن این مقاله زیبا بسیار لذت بردم.
امیدوارم که روز به روز، در زمینه ساخت نرم افزارهای ویژه نابینایان پیشرفتهای قابل ملاحظه ای پدید بیاید تا ما هم بیش از پیش، به دنیای پیچیده و پر رمز و راز اینترنت دسترسی بیابیم.
با احترام: امیر سلامی، سردبیر ماهنامه علم و فرهنگ، ویژه نابینایان

۱۳۸۹ فروردین ۳۰, دوشنبه ساعت ۰:۰۵:۰۰ (‎+۴:۳۰ گرینویچ)  

ارسال یک نظر

اشتراک در نظرات پیام [Atom]

<< صفحهٔ اصلی

موتور جستجوی خود را برای یافتن کلمه ی مورد نظر در اینترنت انتخاب کرده و کلمه ی مورد نظر را بیابید:

Google Yahoo MSN

رفتن به بالاي صفحه