گوگل می‌تواند صحبت‌های شما را با صدای خودتان به زبان دیگری ترجمه کند
کد خبر: ۱۴۵۴۳۳
تعداد نظرات: ۱ نظر
تاریخ انتشار: 2019 May 21    -    ۳۱ ارديبهشت ۱۳۹۸ - ۰۹:۵۸
گوگل با بهره‌گیری از یک مدل شبکه مبتنی بر توالی به توالی (sequence-to-sequence)، ورودی صدا را دریافت کرده و پس از پردازش به یک طیف‌نگاره (spectrogram) تبدیل می‌کند. طیف‌نگاره یک نمایش بصری از فرکانس‌ها است. اکنون، گوگل سعی می‌کند طیف‌نگاره‌ای در زبان جدید تولید و برای خواندن متن ترجمه استفاده کند.

به‌زودی گوگل می‌تواند صحبت‌های شما را با صدای خودتان به زبان دیگری ترجمه کند

به‌زودی گوگل می‌تواند صحبت‌های شما را با صدای خودتان به زبان دیگری ترجمه کند«تابناک باتو» ـ قطعا «Translatotron» یکی از پروژه‌های جذاب و پرسروصدای گوگل در سال‌های آتی خواهد بود.

گوگل روی ترجمه خودکار و طبیعی تمرکز کرده است و می‌خواهد فرآیندهای ترجمه را تا حدود زیادی بهبود ببخشد. در ماه‌های اخیر، زبان‌های بیشتری در گوگل ترنسلیت پشتیبانی شده و حتی چندین لهجه جدید بدان افزوده شده است.

ترجمه همزمان برای نمایشگرها و بلندگوهای هوشمند به ۲۶ زبان زنده دنیا از دیگر دستاوردهای اخیر گوگل است ولی همه این‌ها در برابر پروژه «Translatotron» ناچیز هستند.

گوگل در پروژه «Translatotron» می‌خواهد از صدای کاربران برای ترجمه همزمان استفاده کند. شما به یک زبان صحبت می‌کنید؛ گوگل با صدای شما به زبان دیگری ترجمه می‌کند. تصور کنید فردی به دو زبان انگلیسی و فرانسوی مسلط باشد و بتواند از یکی به دیگری ترجمه کند.

اتفاق ویژه‌ای است و تا کنون هیچ فناوری یا دستاورد هوش مصنوعی قادر به انجام آن نبوده است چون علاوه بر ترجمه زبان، باید صدای فرد هم تقلید و ترجمه شود.

در حال حاضر، برای ترجمه همزمان ابتدا صدای یک فرد به متن تبدیل شده و بعد کامپیوتر آن متن را می‌خواند اما در پروژه «Translatotron» قرار است متن ترجمه با صدای همان فرد خوانده شود.

گوگل در پستی که برای معرفی پروژه «Translatotron» منتشر کرده است؛ اشاره‌هایی به فناوری و نحوه ترجمه مستقیم صدای کاربر از زبان به زبان دیگر دارد.

به‌زودی گوگل می‌تواند صحبت‌های شما را با صدای خودتان به زبان دیگری ترجمه کند

گوگل با بهره‌گیری از یک مدل شبکه مبتنی بر توالی به توالی (sequence-to-sequence)، ورودی صدا را دریافت کرده و پس از پردازش به یک طیف‌نگاره (spectrogram) تبدیل می‌کند. طیف‌نگاره یک نمایش بصری از فرکانس‌ها است. اکنون، گوگل سعی می‌کند طیف‌نگاره‌ای در زبان جدید تولید و برای خواندن متن ترجمه استفاده کند.

به‌زودی گوگل می‌تواند صحبت‌های شما را با صدای خودتان به زبان دیگری ترجمه کند
از این پس، به هر زبان زنده دنیا صحبت کنید

در این روش، هم سرعت ترجمه تا حدود زیادی افزایش پیدا می‌کند و هم صدای کاربر تقلید می‌شود. البته، صدای مصنوعی ساخته شده از لهجه کاربر کاملا طبیعی نیست و مشخص می‌کند که توسط انسان گفته نمی‌شود ولی تا حدود زیادی به ویژگی‌های صدای کاربر حقیقی نزدیک است.

در صفحه گیت‌هاب پروژه «Translatotron» می‌توانید نمونه صداهای تولید شده توسط گوگل را گوش کنید.

قطعا همه ما دوست داریم صحبت‌هایمان با صدای خودمان به زبان دیگری ترجمه شوند. این پروژه گوگل می‌تواند نرم‌افزارهای ترجمه زبان را متحول کند و ده‌ها شاخه کاربردی از آن مجزا شود. تصور کنید قادر به صحبت با هر فردی به هر زبان زنده دنیا باشید.

گوگل پروژه «Translatotron» را از سال ۲۰۱۶ کلید زده و هنوز در مرحله مدل‌سازی و توسعه است. مشخص نیست دقیقا چه زمانی می‌تواند از خروجی این پروژه استفاده کرد.
یک پزشک

نظرات بینندگان
انتشار یافته: ۱
در انتظار بررسی: ۰
غیر قابل انتشار: ۰
ناشناس
|
Iran, Islamic Republic of
|
۰۹:۵۲ - ۱۳۹۸/۰۳/۰۱
0
2
خدا رو شکر کمک بزرگیه
نام:
ایمیل:
* نظر:
آخرین اخبار