ឧបករណ៍សំយោគការនិយាយសម្រាប់កម្មវិធីរុករក Yandex ។ ការកែសម្រួលអត្ថបទជាសំឡេងអន្តរកម្មដោយប្រើបច្ចេកវិទ្យានិយាយថ្មីពី Yandex

តើអ្នកចង់បានព័ត៌មាន ប៉ុន្តែខួរក្បាលរបស់អ្នកធុញទ្រាន់នឹងការមើលឃើញវាមែនទេ? នៅចុងបញ្ចប់នៃថ្ងៃធ្វើការ អ្នកគ្មានការផ្តោតអារម្មណ៍ទេ? ឬប្រហែលជាអ្នកគ្រាន់តែខ្ជិលអាន?

មុននឹងបំបាត់ភាពខ្ជិលក្នុងខ្លួនអ្នក វាមិនមែនជាគំនិតអាក្រក់ក្នុងការបង្កើតមិត្តជាមួយវានោះទេ។ តាមពិតទៅនេះគឺជាមិត្តដ៏ស្មោះត្រង់ និងឈ្លាសវៃដែលសហការគ្នាជាមួយការជំរុញខួរក្បាលពីរអាចបង្រៀន subtleties ជាច្រើនក្នុងជីវិត ដែលជាកន្លែងដែលអ្នកអាចជៀសមិនផុត។ ភ្នំធំប៉ុន្តែសូម្បីតែភ្នំតូចៗ។ តើអ្នកអាចរស់នៅដោយគ្មានភាពតានតឹងដោយរបៀបណា? ភាពខ្ជិលដឹងពីចម្លើយចំពោះសំណួរនេះសម្រាប់ស្ថានភាពបុគ្គលនីមួយៗ។

ជាឧទាហរណ៍ ដើម្បីកុំឱ្យមនុស្សម្នាក់មានភាពតានតឹង និងការពារចក្ខុវិស័យរបស់គាត់ ម៉ាស៊ីនសំយោគសំឡេងត្រូវបានបង្កើត - បញ្ញាសិប្បនិម្មិតដែលអាចបំប្លែងអត្ថបទទៅជាការនិយាយជាសំឡេង និងច្រាសមកវិញ - ការនិយាយទៅជាអត្ថបទ។

រូបមន្តសម្រាប់ការយល់ឃើញព័ត៌មានដែលបានបោះពុម្ពដោយត្រចៀកគឺសាមញ្ញ៖ ដំឡើងនៅលើកុំព្យូទ័ររបស់អ្នកនូវកម្មវិធីណាមួយសម្រាប់អានអត្ថបទជាសំឡេងដូចជា Govorilka ឬ Balabolka បន្ថែមវាជាមួយម៉ាស៊ីនសំឡេងជាភាសារុស្សីដែលមានវាគ្មិនដូចជា Alena, Nikolai, Olga ឬ Katerina ចម្លងអត្ថបទទៅក្នុងកម្មវិធី ហើយចាប់ផ្តើមលេងការនិយាយសិប្បនិម្មិត។ ប៉ុន្តែសូម្បីតែរូបមន្តនេះអាចត្រូវបានធ្វើឱ្យសាមញ្ញ។ អ្នកអាចស្តាប់ការបោះពុម្ពផ្សាយនៅលើគេហទំព័រអ៊ីនធឺណែតដោយចុចពីរបីដងដោយដំឡើងផ្នែកបន្ថែមពិសេសនៅក្នុងកម្មវិធីរុករករបស់អ្នកដែលត្រូវបានរចនាឡើងដើម្បីបំលែងអត្ថបទទៅជាការនិយាយ។

ផ្នែកបន្ថែម Chrome SpeakIt!៖ ឧបករណ៍សំយោគការនិយាយនៅខាងក្នុងកម្មវិធីរុករកសម្រាប់អ្នកដែលខ្ជិលអាន

ផ្នែកបន្ថែមសម្រាប់កម្មវិធីរុករកតាមអ៊ីនធឺណិតដែលមានមូលដ្ឋានលើ Chromium SpeakIt! អាចអានអត្ថបទជាជាង 50 ភាសា រួមទាំងភាសារុស្សី។ ម៉ាស៊ីនសំឡេងជាភាសារុស្សីត្រូវបានដំឡើងរួចហើយនៅក្នុងវា ដូច្នេះមិនចាំបាច់មានជំហានបន្ថែមដើម្បីដំឡើងសមាសធាតុកម្មវិធីនីមួយៗទេ។ អ្វីដែលអ្នកត្រូវធ្វើ យកឈ្នះលើភាពខ្ជិលរបស់អ្នករយៈពេលពីរបីនាទី គឺត្រូវដំឡើងពីហាង Google Chromeនិយាយវា! វាមកដោយឥតគិតថ្លៃទាំងស្រុង។

បន្ទាប់ពីដំឡើង SpeakIt! ត្រូវបានបង្កើតឡើងនៅក្នុងរបារឧបករណ៍របស់កម្មវិធីរុករកដោយមានប៊ូតុងមួយក្នុងទម្រង់ជារូបតំណាងអ្នកនិយាយ។ ការចុចប៊ូតុងកណ្ដុរខាងឆ្វេងនឹងបើកចំណុចប្រទាក់ខ្នាតតូចនៃផ្នែកបន្ថែមដែលមានប៊ូតុងដើម្បីចាប់ផ្តើមការចាក់សារថ្មី និងប៊ូតុងបញ្ឈប់។

ចុចកណ្ដុរស្ដាំលើ SpeakIt! នឹងបើកម៉ឺនុយបរិបទដែលយើងត្រូវជ្រើសរើសពាក្យបញ្ជា "ជម្រើស" ។

នៅទីនេះ នៅក្នុងការកំណត់ផ្នែកបន្ថែម ពីបញ្ជីទម្លាក់ចុះ យើងអាចកំណត់ម៉ាស៊ីនសំឡេងខុសពីកម្មវិធីដែលបានដំឡើងជាមុនជាមួយអ្នកប្រកាសដែលនិយាយភាសារុស្សី យើងអាចជ្រើសរើសសំឡេងស្រី ឬប្រុស។ យើងក៏អាចកែតម្រូវកម្រិត និងល្បឿននៃការចាក់សារឡើងវិញដោយអូសគ្រាប់រំកិលនៃជម្រើសដែលត្រូវគ្នា។

ជម្រើសនៃអ្នកប្រកាសនិយាយភាសារុស្សីដែលមានសំឡេងប្រុស ឬស្រី គឺមានវត្តមានសម្រាប់តែម៉ាស៊ីនសំឡេង iSpeech ប៉ុណ្ណោះ។ និយាយម៉ាស៊ីន! អាចអានបានតែសំឡេងស្រីប៉ុណ្ណោះ។ ហើយម៉ាស៊ីនដើមអាចត្រូវបានប្រើដោយសុវត្ថិភាពដោយអ្នកដែលស៊ាំនឹងសំឡេងដ៏ពីរោះរបស់ឌីហ្គាឡូរបស់ Nikolay។ បញ្ចូលឃ្លាណាមួយទៅក្នុងវាល "សាកល្បង" ហើយសាកល្បងម៉ាស៊ីនសំឡេង និងឧបករណ៍បំពងសំឡេងជាច្រើន។ នេះនឹងជួយអ្នកគ្រប់គ្នាជ្រើសរើសការផលិតការនិយាយដ៏ល្អប្រសើរសម្រាប់ខ្លួនពួកគេ។ ប្រសិនបើការបោះពុម្ពផ្សាយតាមអ៊ីនធឺណិតជាភាសាអង់គ្លេស នោះយើងសាកល្បងម៉ាស៊ីនសំឡេងជាភាសាអង់គ្លេស។

ជាការប្រសើរណាស់ យើងបានសម្រេចចិត្តលើការកំណត់ផ្នែកបន្ថែម ឥឡូវនេះ សូមបន្តដោយផ្ទាល់ទៅដំណើរការនៃការផលិតការបោះពុម្ពផ្សាយតាមអ៊ីនធឺណិតឡើងវិញជាសំឡេងសិប្បនិម្មិត។ នៅលើទំព័របណ្តាញនៃការបោះពុម្ពដែលអ្នកចាប់អារម្មណ៍ សូមជ្រើសរើសអត្ថបទដែលអ្នកចង់ផលិតឡើងវិញ បន្ទាប់មកហៅទៅកាន់ម៉ឺនុយបរិបទ ហើយចុចប៊ូតុង SpeakIt ឬចុចប៊ូតុងសម្រាប់ផ្នែកបន្ថែមនេះនៅលើបន្ទះកម្មវិធីរុករក។

នៅក្នុងសន្និសិទមួយផ្សេងទៀតឆ្នាំ 2013 យើងបានបង្ហាញរបស់យើង។ បណ្ណាល័យថ្មី។ Yandex SpeechKit ។ នេះគឺជា API សាធារណៈសម្រាប់ការទទួលស្គាល់ការនិយាយ ដែលអាចប្រើដោយអ្នកអភិវឌ្ឍន៍ Android និង iOS ។ អ្នកអាចទាញយក SpeechKit ហើយអានឯកសារផងដែរ។

Yandex SpeechKit អនុញ្ញាតឱ្យអ្នកចូលប្រើផ្នែកខាងក្រោយដោយផ្ទាល់ដែលត្រូវបានប្រើដោយជោគជ័យនៅក្នុងកម្មវិធីទូរស័ព្ទ Yandex ។ យើងបានបង្កើតប្រព័ន្ធនេះជាយូរមកហើយ ហើយឥឡូវនេះយើងទទួលស្គាល់បានត្រឹមត្រូវ 94% នៃពាក្យក្នុង Navigator និង Mobile Maps ព្រមទាំង 84% នៃពាក្យក្នុង Mobile Browser។ ក្នុងករណីនេះ ការទទួលស្គាល់ត្រូវចំណាយពេលច្រើនជាងមួយវិនាទី។ នេះគឺជាគុណភាពដ៏សមរម្យមួយរួចហើយ ហើយយើងកំពុងធ្វើការយ៉ាងសកម្មដើម្បីកែលម្អវា។

វាអាចត្រូវបានអះអាងថានៅក្នុងពេលអនាគតដ៏ខ្លីខាងមុខ ចំណុចប្រទាក់សំឡេងនឹងមិនមានភាពខុសប្លែកគ្នាក្នុងភាពជឿជាក់ពីវិធីសាស្ត្របញ្ចូលបុរាណទេ។ រឿងលម្អិតអំពីរបៀបដែលយើងគ្រប់គ្រងដើម្បីសម្រេចបានលទ្ធផលបែបនេះ និងរបៀបដែលប្រព័ន្ធរបស់យើងដំណើរការ នៅក្រោមការកាត់។

ការទទួលស្គាល់ការនិយាយគឺជាផ្នែកមួយនៃការចាប់អារម្មណ៍បំផុតនិង កិច្ចការស្មុគស្មាញ បញ្ញាសិប្បនិម្មិត. សមិទ្ធិផលដែលពាក់ព័ន្ធនៅទីនេះគឺខ្លាំងណាស់ តំបន់ផ្សេងៗ៖ ពី ភាសាវិទ្យាគណនាទៅ ដំណើរការឌីជីថលសញ្ញា។ ដើម្បីយល់ពីរបៀបដែលម៉ាស៊ីនដែលយល់ពីការនិយាយគួរតែត្រូវបានរៀបចំឡើង ចូរយើងយល់ពីអ្វីដែលយើងកំពុងដោះស្រាយជាមុនសិន។

I. មូលដ្ឋាន

សម្រាប់យើង ការនិយាយដែលនិយាយគឺជាសញ្ញាឌីជីថល។ ហើយបើយើងក្រឡេកមើលការថតសញ្ញានេះ យើងនឹងមិនឃើញទាំងពាក្យ ឬច្បាស់ឡើយ។ phonemes បញ្ចេញសំឡេង- "ព្រឹត្តិការណ៍និយាយ" ផ្សេងគ្នាហូរចូលគ្នាទៅវិញទៅមកដោយរលូនដោយមិនបង្កើតព្រំដែនច្បាស់លាស់។ ពាក្យដដែលនិយាយ មនុស្សផ្សេងគ្នាឬនៅក្នុងបរិយាកាសផ្សេងៗគ្នា កម្រិតសញ្ញានឹងមើលទៅខុសគ្នា។ ក្នុងពេលជាមួយគ្នានេះ មនុស្សខ្លះទទួលស្គាល់ការនិយាយរបស់គ្នាទៅវិញទៅមក៖ ដូច្នេះហើយ មានភាពប្រែប្រួលអាស្រ័យទៅតាមសញ្ញា វាអាចបង្កើតឡើងវិញនូវអ្វីដែលបាននិយាយពិតប្រាកដ។ ការស្វែងរកបំរែបំរួលបែបនេះគឺជាភារកិច្ចនៃគំរូសូរស័ព្ទ។

ចូរសន្មត់ថាការនិយាយរបស់មនុស្សមានសូរសព្ទ (នេះគឺជាការធ្វើឱ្យសាមញ្ញសរុប ប៉ុន្តែចំពោះការប៉ាន់ស្មានដំបូងវាត្រឹមត្រូវ)។ ចូរកំណត់សូរសព្ទជាឯកតាអត្ថន័យអប្បបរមានៃភាសា នោះគឺជាសំឡេង ការជំនួសដែលអាចនាំឱ្យមានការផ្លាស់ប្តូរអត្ថន័យនៃពាក្យ ឬឃ្លា។ ចូរយកផ្នែកតូចមួយនៃសញ្ញា និយាយថា 25 មីលីវិនាទី។ ចូរហៅផ្នែកនេះថា "ស៊ុម" ។ តើទូរស័ព្ទមួយណាត្រូវបាននិយាយនៅក្នុងស៊ុមនេះ? វាពិបាកក្នុងការឆ្លើយសំណួរនេះដោយមិនច្បាស់លាស់ - សូរស័ព្ទជាច្រើនគឺស្រដៀងនឹងគ្នាទៅវិញទៅមក។ ប៉ុន្តែប្រសិនបើវាមិនអាចទៅរួចទេក្នុងការផ្តល់ចម្លើយដែលមិនច្បាស់លាស់ នោះគេអាចវែកញែកក្នុងន័យនៃ "ប្រូបាប៊ីលីតេ"៖ សម្រាប់សញ្ញាដែលបានផ្តល់ឱ្យ សូរស័ព្ទខ្លះទំនងជាទំនងជាង ខ្លះទៀតប្រហែលតិច ហើយអ្នកផ្សេងទៀតអាចត្រូវបានដកចេញពីការពិចារណាទាំងអស់គ្នា។ តាមពិត គំរូសូរស័ព្ទ គឺជាមុខងារមួយដែលយកផ្នែកតូចមួយនៃសញ្ញាសូរស័ព្ទ (ស៊ុម) ហើយបង្កើតការចែកចាយប្រូបាប៊ីលីតេនៃសូរស័ព្ទផ្សេងៗនៅលើស៊ុមនេះ។ ដូច្នេះ គំរូសូរស័ព្ទអនុញ្ញាតឱ្យយើងបង្កើតឡើងវិញដោយសំឡេងអ្វីដែលបាននិយាយ - ជាមួយនឹងកម្រិតនៃភាពជឿជាក់ខុសៗគ្នា។

មួយទៀត ទិដ្ឋភាពសំខាន់សូរស័ព្ទ - ប្រូបាប៊ីលីតេនៃការផ្លាស់ប្តូររវាងសូរស័ព្ទផ្សេងៗគ្នា។ តាមបទពិសោធន៍ យើងដឹងថា បន្សំនៃសូរសព្ទមួយចំនួនមានភាពងាយស្រួលក្នុងការបញ្ចេញសំឡេង និងកើតឡើងញឹកញាប់ ខណៈពេលដែលអ្នកផ្សេងទៀតពិបាកបញ្ចេញសំឡេង ហើយត្រូវបានគេប្រើតិចជាញឹកញាប់ក្នុងការអនុវត្ត។ យើងអាចសង្ខេបព័ត៌មាននេះ ហើយយកមកពិចារណានៅពេលវាយតម្លៃ "ភាពអាចជឿជាក់បាន" នៃលំដាប់ជាក់លាក់នៃសូរសព្ទ។

ឥឡូវនេះយើងមានឧបករណ៍ទាំងអស់ដើម្បីរចនាមួយនៃ "កម្មករ" សំខាន់ ការទទួលស្គាល់ដោយស្វ័យប្រវត្តិសុន្ទរកថា - គំរូ Markov ដែលលាក់ (HMM, Hidden Markov Model) ។ ដើម្បីធ្វើដូច្នេះ សូមស្រមៃមើលមួយភ្លែតថា យើងមិនដោះស្រាយបញ្ហានៃការទទួលស្គាល់ការនិយាយនោះទេ ប៉ុន្តែផ្ទុយស្រឡះទៅវិញ - ការបំប្លែងអត្ថបទទៅជាការនិយាយ។ ចូរនិយាយថាយើងចង់ទទួលបានការបញ្ចេញសំឡេងនៃពាក្យ "Yandex" ។ សូមឱ្យពាក្យ "Yandex" មានសំណុំនៃ phonemes និយាយថា [th][a][n][d][e][k][s] ។ ចូរយើងបង្កើតម៉ាស៊ីនរដ្ឋកំណត់សម្រាប់ពាក្យ "Yandex" ដែលនៅក្នុងនោះ phoneme នីមួយៗត្រូវបានតំណាងដោយរដ្ឋដាច់ដោយឡែកមួយ។ រាល់ពេលដែលយើងស្ថិតនៅក្នុងរដ្ឋមួយក្នុងចំណោមរដ្ឋទាំងនេះ ហើយ "បញ្ចេញ" លក្ខណៈសំឡេងនៃសូរស័ព្ទនេះ (យើងដឹងពីរបៀបដែលសូរស័ព្ទនីមួយៗត្រូវបានបញ្ចេញដោយអរគុណចំពោះគំរូសូរស័ព្ទ) ។ ប៉ុន្តែសូរសព្ទខ្លះមានរយៈពេលយូរ (ដូចជា [a] នៅក្នុងពាក្យ "Yandex") ខ្លះទៀតត្រូវបានលេបយ៉ាងសកម្ម។ នេះគឺជាកន្លែងដែលព័ត៌មានអំពីប្រូបាប៊ីលីតេនៃការផ្លាស់ប្តូររវាង phonemes មានប្រយោជន៍។ ដោយបានបង្កើតសំឡេងដែលត្រូវគ្នា។ ស្ថានភាពបច្ចុប្បន្ន, យើងទទួលយក ដំណោះស្រាយប្រូបាប៊ីលីតេ៖ យើងគួរនៅតែនៅក្នុងស្ថានភាពដដែល ឬបន្តទៅមួយបន្ទាប់ (ហើយតាមនោះ ទូរស័ព្ទបន្ទាប់)។

ជាផ្លូវការជាងនេះ HMM អាចត្រូវបានតំណាង ដូចខាងក្រោម. ជាដំបូងសូមណែនាំគំនិតនៃការបំភាយឧស្ម័ន។ ដូចដែលយើងចងចាំពីឧទាហរណ៍មុន រដ្ឋ HMM នីមួយៗ "បង្កើត" លក្ខណៈសំឡេងនៃរដ្ឋពិសេសនេះ (ឧទាហរណ៍ phoneme) ។ នៅស៊ុមនីមួយៗ សំឡេងត្រូវបាន "លេងចេញ" ពីការចែកចាយប្រូបាប៊ីលីតេដែលត្រូវគ្នាទៅនឹងសូរស័ព្ទដែលបានផ្តល់ឱ្យ។ ទីពីរ ដំណើរផ្លាស់ប្តូរអាចធ្វើទៅបានរវាងរដ្ឋ ក៏ជាកម្មវត្ថុនៃគំរូប្រូបាបដែលបានកំណត់ទុកជាមុនផងដែរ។ ឧទាហរណ៍ ប្រូបាប៊ីលីតេដែល phoneme [a] នឹង “stretch” គឺខ្ពស់ ដែលមិនអាចនិយាយបានអំពី phoneme [d]។ ម៉ាទ្រីសបំភាយ និងម៉ាទ្រីសអន្តរកាលកំណត់តែមួយគត់នូវគំរូ Markov ដែលលាក់។

មិនអីទេ យើងបានមើលពីរបៀបដែល Hidden Markov Model អាចត្រូវបានប្រើដើម្បីបង្កើតការនិយាយ ប៉ុន្តែតើយើងអាចអនុវត្តវាទៅនឹងបញ្ហាបញ្ច្រាសនៃការទទួលស្គាល់ការនិយាយយ៉ាងដូចម្តេច? ក្បួនដោះស្រាយ Viterbi មកជួយសង្គ្រោះ។ យើងមានសំណុំនៃបរិមាណដែលអាចសង្កេតបាន (តាមពិតសំឡេង) និងគំរូប្រូបាប៊ីលីតេដែលទាក់ទងរដ្ឋលាក់កំបាំង (សូរសព្ទ) និងបរិមាណដែលបានសង្កេត។ ក្បួនដោះស្រាយ Viterbi អនុញ្ញាតឱ្យអ្នកស្តារលំដាប់ដែលទំនងបំផុតនៃរដ្ឋដែលលាក់។

សូមឲ្យមានតែពាក្យពីរនៅក្នុងវចនានុក្រមទទួលស្គាល់របស់យើង៖ “បាទ” ([d][a]) និង “ទេ” ([n”][e][t]) ដូច្នេះហើយ យើងមានគំរូ Markov ដែលលាក់ពីរ។ អនុញ្ញាតឱ្យយើងកត់ត្រាសំឡេងរបស់អ្នកប្រើដោយនិយាយថា "បាទ" ឬ "ទេ" ក្បួនដោះស្រាយ Viterbi នឹងអនុញ្ញាតឱ្យយើងឆ្លើយសំណួរថាតើសម្មតិកម្មការទទួលស្គាល់មួយណាទំនងជាង។

ឥឡូវនេះ ភារកិច្ចរបស់យើងចុះមកដើម្បីស្ដារឡើងវិញនូវលំដាប់ដែលទំនងបំផុតនៃរដ្ឋនៃគំរូ Markov ដែលបានលាក់ដែល "បង្កើត" (ច្បាស់ជាងនេះទៅទៀត អាចបង្កើតបាន) ការថតសំឡេងដែលបង្ហាញដល់ពួកយើង។ ប្រសិនបើអ្នកប្រើនិយាយថា "បាទ / ចាស" នោះលំដាប់រដ្ឋដែលត្រូវគ្នាជាង 10 ស៊ុមអាចជាឧទាហរណ៍ [d][d][d][d][a][a][a][a][a][a][ a] ឬ [d][a][a][a][a][a][a][a][a][a] ។ ដូចគ្នានេះដែរវាអាចទៅរួច ជម្រើសផ្សេងៗការបញ្ចេញសំឡេងសម្រាប់ "ទេ" - ឧទាហរណ៍ [n"][n"][n"][e][e][e][e][t][t][t] និង [n"][n" ] [e][e][e][e][e][e][t][t] ឥឡូវនេះ យើងនឹងរកឃើញ "ល្អបំផុត" ដែលទំនងជាបំផុតវិធីបញ្ចេញពាក្យនីមួយៗ ស៊ុមយើងនឹងសួរគំរូសូរស័ព្ទរបស់យើង ថាតើវាទំនងយ៉ាងណាដែលសូរស័ព្ទជាក់លាក់មួយនៅទីនេះ (ឧទាហរណ៍ [ឃ] និង [a]); [d], [d]->[a], [a]]->[a]) វិធីនេះ យើងនឹងទទួលបាននូវវិធីដែលទំនងបំផុតក្នុងការប្រកាសពាក្យសម្មតិកម្មនីមួយៗ លើសពីនេះទៅទៀត សម្រាប់ពួកវានីមួយៗ យើងនឹងទទួលបាន រង្វាស់នៃរបៀបដែលវាទំនងជាថាពាក្យជាក់លាក់នេះត្រូវបានប្រកាស (យើងអាចពិចារណារង្វាស់នេះជាប្រវែងនៃផ្លូវខ្លីបំផុតតាមរយៈក្រាហ្វដែលត្រូវគ្នា) សម្មតិកម្ម "ការឈ្នះ" (ដែលទំនងជាងនេះ) នឹងត្រូវបានត្រឡប់ជា លទ្ធផលនៃការទទួលស្គាល់។

ក្បួនដោះស្រាយ Viterbi គឺសាមញ្ញណាស់ក្នុងការអនុវត្ត (កម្មវិធីថាមវន្តត្រូវបានប្រើប្រាស់) និងដំណើរការក្នុងសមាមាត្រពេលវេលាទៅនឹងផលិតផលនៃចំនួនរដ្ឋ HMM និងចំនួនស៊ុម។ ទោះយ៉ាងណាក៏ដោយ វាមិនតែងតែគ្រប់គ្រាន់សម្រាប់ពួកយើងដើម្បីដឹងពីផ្លូវដែលទំនងបំផុតនោះទេ។ ឧទាហរណ៍ នៅពេលបណ្តុះបណ្តាលគំរូសូរស័ព្ទ អ្នកត្រូវប៉ាន់ស្មានប្រូបាប៊ីលីតេនៃរដ្ឋនីមួយៗនៅស៊ុមនីមួយៗ។ ចំពោះគោលបំណងនេះ ក្បួនដោះស្រាយឆ្ពោះទៅមុខ-ថយក្រោយត្រូវបានប្រើ។

ទោះជាយ៉ាងណាក៏ដោយ គំរូសូរស័ព្ទគឺគ្រាន់តែជាធាតុផ្សំនៃប្រព័ន្ធប៉ុណ្ណោះ។ អ្វីដែលត្រូវធ្វើប្រសិនបើវចនានុក្រមទទួលស្គាល់មិនមានពាក្យពីរដូចក្នុងឧទាហរណ៍ដែលបានពិភាក្សាខាងលើប៉ុន្តែមានរាប់រយរាប់ពាន់ឬរាប់លាន? ពួកគេជាច្រើននឹងមានភាពស្រដៀងគ្នាខ្លាំងនៅក្នុងការបញ្ចេញសំឡេង ឬសូម្បីតែដូចគ្នា។ ក្នុងពេលជាមួយគ្នានេះ នៅក្នុងវត្តមាននៃបរិបទ តួនាទីនៃសូរស័ព្ទមានការថយចុះ៖ ពាក្យអសុរោះ សំលេងរំខាន ឬមិនច្បាស់លាស់អាចត្រូវបានស្ដារឡើងវិញ "តាមអត្ថន័យ"។ ដើម្បីយកទៅក្នុងគណនីបរិបទ ពួកវាត្រូវបានគេប្រើម្តងទៀត គំរូប្រូបាប៊ីលីតេ. ជាឧទាហរណ៍ អ្នកនិយាយភាសារុស្សីម្នាក់យល់ថា ភាពធម្មជាតិ (ក្នុងករណីរបស់យើង ប្រូបាប៊ីលីតេ) នៃប្រយោគ "ម៉ាក់លាងស៊ុម" គឺខ្ពស់ជាង "ម៉ាក់លាងស៊ីក្លូ" ឬ "ម៉ាក់លាងស៊ុម"។ នោះគឺវត្តមាននៃបរិបទថេរ "ម្តាយនៃសាប៊ូ ... " កំណត់ការចែកចាយប្រូបាប៊ីលីតេសម្រាប់ ពាក្យបន្ទាប់ដែលឆ្លុះបញ្ចាំងទាំងអត្ថន័យ និងរូបវិទ្យា។ ប្រភេទនៃគំរូភាសានេះត្រូវបានគេហៅថាគំរូភាសា n-gram (ត្រីកោណក្នុងឧទាហរណ៍ដែលបានពិភាក្សាខាងលើ); ជាការពិតណាស់ មានវិធីស្មុគស្មាញ និងមានឥទ្ធិពលច្រើនទៀតក្នុងការធ្វើគំរូភាសា។

II. តើអ្វីនៅក្រោមក្រណាត់របស់ Yandex ASR?

ឥឡូវនេះដែលយើងស្រមៃ ឧបករណ៍ទូទៅប្រព័ន្ធទទួលស្គាល់ការនិយាយ យើងនឹងរៀបរាប់លម្អិតបន្ថែមទៀតអំពីព័ត៌មានលម្អិតនៃបច្ចេកវិទ្យា Yandex - ល្អបំផុតនេះបើយោងតាមទិន្នន័យរបស់យើង ប្រព័ន្ធទទួលស្គាល់ការនិយាយភាសារុស្សី។
ក្នុងការពិចារណាលើឧទាហរណ៍នៃប្រដាប់ប្រដាក្មេងលេងខាងលើ យើងបានធ្វើឱ្យមានភាពសាមញ្ញមួយចំនួនដោយចេតនា ហើយបានលុបចោលព័ត៌មានលម្អិតសំខាន់ៗមួយចំនួន។ ជាពិសេស យើងបានប្រកែកថា "អង្គភាពកសាង" មូលដ្ឋាននៃការនិយាយគឺជាសូរសព្ទ។ តាមការពិត ទូរសព្ទមានទំហំធំពេក។ ដើម្បីធ្វើគំរូឱ្យបានគ្រប់គ្រាន់នៃការបញ្ចេញសំឡេងនៃសូរសព្ទតែមួយ រដ្ឋបីដាច់ដោយឡែកត្រូវបានប្រើ - ការចាប់ផ្តើម កណ្តាល និងចុងបញ្ចប់នៃសូរសព្ទ។ ពួកគេរួមគ្នាបង្កើត HMM ដូចបានបង្ហាញខាងលើ។ លើសពីនេះទៀត phonemes គឺអាស្រ័យលើទីតាំង និងអាស្រ័យលើបរិបទ៖ ជាផ្លូវការ សូរសព្ទ "ដូចគ្នា" ស្តាប់ទៅខុសគ្នាយ៉ាងខ្លាំង អាស្រ័យលើផ្នែកនៃពាក្យដែលវាស្ថិតនៅក្នុង និងអ្វីដែល phonemes វានៅជិត។ ក្នុងពេលជាមួយគ្នានេះបញ្ជីសាមញ្ញនៃទាំងអស់។ ជម្រើសដែលអាចធ្វើបានសូរសព្ទដែលប្រកាន់បរិបទនឹងត្រលប់មកវិញយ៉ាងខ្លាំង ចំនួនធំបន្សំ ដែលភាគច្រើនមិនត្រូវបានរកឃើញនៅក្នុង ជីវិតពិត; ដើម្បីធ្វើឱ្យចំនួននៃព្រឹត្តិការណ៍សូរស័ព្ទត្រូវបានចាត់ទុកថាសមហេតុផល សូរស័ព្ទដែលប្រកាន់ខ្ជាប់បរិបទជិតស្និទ្ធត្រូវបានបញ្ចូលទៅក្នុង ដំណាក់កាលដំបូងការបណ្តុះបណ្តាល និងត្រូវបានពិចារណារួមគ្នា។
ដូច្នេះ ទីមួយ យើងបានធ្វើឱ្យសូរសព្ទមានលក្ខណៈប្រែប្រួលតាមបរិបទ ហើយទីពីរ យើងបែងចែកពួកវានីមួយៗជាបីផ្នែក។ វត្ថុទាំងនេះ - "ផ្នែក phoneme" - ឥឡូវនេះបង្កើតរបស់យើង។ អក្ខរក្រមសូរសព្ទ. ពួកគេត្រូវបានគេហៅថា Senones ផងដែរ។ រដ្ឋនីមួយៗនៃ HMM របស់យើងគឺ senon ។ ម៉ូដែលរបស់យើងប្រើ 48 phonemes និងប្រហែល 4000 senones ។

ដូច្នេះ គំរូសូរស័ព្ទរបស់យើងនៅតែយកសំឡេងជាការបញ្ចូល ហើយនៅទិន្នផលវាផ្តល់នូវការចែកចាយប្រូបាប៊ីលីតេលើសេណូន។ ឥឡូវនេះសូមក្រឡេកមើលអ្វីដែលពិតប្រាកដត្រូវបានផ្គត់ផ្គង់ដល់ការបញ្ចូល។ ដូចដែលយើងបាននិយាយ សំឡេងត្រូវបានកាត់ជាផ្នែក 25 ms ("ស៊ុម") ។ ជាធម្មតា ជំហានកាត់គឺ 10 ms ដូច្នេះស៊ុមដែលនៅជាប់គ្នាត្រួតលើគ្នាដោយផ្នែក។ វាច្បាស់ណាស់ថាសំឡេង "ឆៅ" - ទំហំនៃលំយោលតាមពេលវេលា - មិនមែនជាទម្រង់ដែលផ្តល់ព័ត៌មានបំផុតនៃការតំណាងឱ្យសញ្ញាសូរស័ព្ទនោះទេ។ វិសាលគមនៃសញ្ញានេះគឺល្អជាង។ នៅក្នុងការអនុវត្ត វិសាលគមលោការីត និងមាត្រដ្ឋានត្រូវបានប្រើប្រាស់ជាធម្មតា ដែលត្រូវនឹងច្បាប់របស់មនុស្ស។ ការយល់ឃើញ auditory(ការផ្លាស់ប្តូរ Mel-) ។ តម្លៃលទ្ធផលត្រូវបានទទួលរងនូវការបំប្លែងកូស៊ីនុសដាច់ដោយឡែក (DCT) ហើយលទ្ធផលគឺ MFCC - Mel Frequency Cepstral Coefficients ។ (ពាក្យ Cepstral ត្រូវបានទទួលដោយការរៀបចំអក្សរឡើងវិញនៅក្នុង Spectral ដែលឆ្លុះបញ្ចាំងពីវត្តមានរបស់ DCT បន្ថែម)។ MFCC គឺជាវ៉ិចទ័រនៃ 13 (ជាធម្មតា) ចំនួនពិត។ ពួកវាអាចត្រូវបានប្រើជាការបញ្ចូលទៅក្នុងគំរូសូរស័ព្ទក្នុងទម្រង់ឆៅរបស់វា ប៉ុន្តែជារឿយៗត្រូវទទួលរងការបំប្លែងបន្ថែមជាច្រើន។

ការបណ្តុះបណ្តាលគំរូសូរស័ព្ទ គឺជាដំណើរការស្មុគស្មាញ និងច្រើនជំហាន។ សម្រាប់ការបណ្តុះបណ្តាល ក្បួនដោះស្រាយពីគ្រួសាររំពឹងទុក-អតិបរមាត្រូវបានប្រើ ដូចជាក្បួនដោះស្រាយ Baum-Welsh ជាដើម។ ខ្លឹមសារនៃក្បួនដោះស្រាយនៃប្រភេទនេះគឺការឆ្លាស់គ្នានៃជំហានពីរ៖ នៅជំហានរំពឹងទុក គំរូដែលមានស្រាប់ត្រូវបានប្រើដើម្បីគណនាការរំពឹងទុកនៃមុខងារលទ្ធភាពនៅជំហានអតិបរមា ប៉ារ៉ាម៉ែត្រគំរូត្រូវបានផ្លាស់ប្តូរក្នុងវិធីមួយដើម្បីពង្រីកអតិបរមា ការប៉ាន់ស្មាននេះ។ នៅដំណាក់កាលដំបូងនៃវគ្គបណ្តុះបណ្តាល គំរូសូរស័ព្ទសាមញ្ញត្រូវបានប្រើប្រាស់៖ លក្ខណៈ MFCC សាមញ្ញត្រូវបានផ្តល់ជាធាតុបញ្ចូល សូរស័ព្ទត្រូវបានពិចារណាដោយមិនពឹងផ្អែកលើបរិបទ និងល្បាយនៃ Gaussians ដែលមានម៉ាទ្រីសអង្កត់ទ្រូង (Diagonal GMMs - Gaussian Mixture Models) ត្រូវបានប្រើដើម្បីធ្វើគំរូ។ ប្រូបាប៊ីលីតេនៃការបំភាយឧស្ម័ននៅក្នុង HMM ។ លទ្ធផលនៃគំរូសូរស័ព្ទពីមុននីមួយៗគឺជាចំណុចចាប់ផ្តើមសម្រាប់ការបណ្តុះបណ្តាលបន្ថែមទៀត គំរូស្មុគស្មាញជាមួយនឹងមុខងារចែកចាយប្រូបាប៊ីលីតេនៃការបញ្ចូល ទិន្នផល ឬការបញ្ចេញដែលស្មុគស្មាញជាង។ មានវិធីជាច្រើនដើម្បីកែលម្អគំរូសូរស័ព្ទ ប៉ុន្តែឥទ្ធិពលដ៏សំខាន់បំផុតគឺការផ្លាស់ប្តូរពីគំរូ GMM ទៅ DNN (បណ្តាញសរសៃប្រសាទជ្រៅ) ដែលស្ទើរតែបង្កើនគុណភាពនៃការទទួលស្គាល់ទ្វេដង។ បណ្តាញសរសៃប្រសាទមិនមានដែនកំណត់ជាច្រើននៃល្បាយ Gaussian និងមានសមត្ថភាពទូទៅប្រសើរជាងមុន។ លើសពីនេះទៀតម៉ូដែលសូរស័ព្ទនៅលើ បណ្តាញសរសៃប្រសាទធន់នឹងសំលេងរំខាន និងមានដំណើរការល្អជាង។

បណ្តាញសរសៃប្រសាទសម្រាប់ការធ្វើគំរូសូរស័ព្ទត្រូវបានបណ្តុះបណ្តាលក្នុងដំណាក់កាលជាច្រើន។ ដើម្បីចាប់ផ្តើមបណ្តាញសរសៃប្រសាទ ជង់នៃម៉ាស៊ីន Boltzmann ដែលត្រូវបានរឹតបន្តឹង (RBM) ត្រូវបានប្រើ។ RBM គឺជាបណ្តាញសរសៃប្រសាទ stochastic ដែលបណ្តុះបណ្តាលដោយគ្មានគ្រូ។ ទោះបីជាទម្ងន់ដែលនាងបានរៀនមិនអាចប្រើដោយផ្ទាល់ដើម្បីបែងចែករវាងថ្នាក់នៃព្រឹត្តិការណ៍សូរស័ព្ទក៏ដោយ ពួកវាឆ្លុះបញ្ចាំងពីរចនាសម្ព័ន្ធនៃការនិយាយយ៉ាងលម្អិត។ អ្នកអាចគិតថា RBM ជាអ្នកទាញយកលក្ខណៈពិសេសមួយ - គំរូបង្កើតលទ្ធផលប្រែទៅជាចំណុចចាប់ផ្តើមដ៏ល្អសម្រាប់ការកសាងគំរូរើសអើង។ គំរូនៃការរើសអើងត្រូវបានបណ្តុះបណ្តាលដោយប្រើក្បួនដោះស្រាយការផ្សាយឡើងវិញបែបបុរាណ ដែលអនុវត្តចំនួននៃ បច្ចេកទេសធ្វើអោយប្រសើរឡើងនូវការរួបរួមគ្នា និងទប់ស្កាត់ការពាក់លើសទម្ងន់។ ជាលទ្ធផលការបញ្ចូលនៃបណ្តាញសរសៃប្រសាទគឺជាស៊ុមលក្ខណៈពិសេស MFCC ជាច្រើន (ស៊ុមកណ្តាលត្រូវបានចាត់ថ្នាក់ហើយនៅសល់បង្កើតជាបរិបទ) ទិន្នផលគឺប្រហែល 4000 ណឺរ៉ូនដែលត្រូវគ្នានឹង senons ផ្សេងៗ។ បណ្តាញសរសៃប្រសាទនេះត្រូវបានប្រើជាគំរូសូរស័ព្ទនៅក្នុងប្រព័ន្ធផលិតកម្ម។

ចូរយើងពិនិត្យមើលឱ្យកាន់តែច្បាស់អំពីដំណើរការឌិកូដ។ សម្រាប់ភារកិច្ចទទួលស្គាល់ ការនិយាយដោយឯកឯងជាមួយនឹងវាក្យសព្ទធំ វិធីសាស្រ្តដែលបានពិពណ៌នានៅក្នុងផ្នែកទីមួយមិនត្រូវបានអនុវត្តទេ។ អ្នកត្រូវការរចនាសម្ព័ន្ធទិន្នន័យដែលភ្ជាប់អ្វីៗគ្រប់យ៉ាងជាមួយគ្នា សំណើដែលអាចធ្វើបានដែលប្រព័ន្ធអាចទទួលស្គាល់។ រចនាសម្ព័នសមស្របគឺជាឧបករណ៍បំប្លែងរដ្ឋដែលមានទម្ងន់កំណត់ (WFST) - សំខាន់គ្រាន់តែជាម៉ាស៊ីនរដ្ឋកំណត់ដែលមានកាសែតទិន្នផល និងទម្ងន់នៅលើគែម។ នៅការបញ្ចូលរបស់ម៉ាស៊ីននេះគឺ senons, នៅទិន្នផលគឺជាពាក្យ។ ដំណើរការឌិកូដមកលើការជ្រើសរើស វិធីល្អបំផុតនៅក្នុងម៉ាស៊ីននេះ ហើយផ្តល់នូវលំដាប់លទ្ធផលនៃពាក្យដែលត្រូវគ្នាទៅនឹងផ្លូវនេះ។ ក្នុងករណីនេះតម្លៃនៃការឆ្លងកាត់តាមបណ្តោយធ្នូនីមួយៗមានធាតុផ្សំពីរ។ សមាសធាតុទីមួយត្រូវបានគេដឹងជាមុនហើយត្រូវបានគណនានៅដំណាក់កាលនៃការផ្គុំម៉ាស៊ីន។ វារួមបញ្ចូលទាំងការចំណាយនៃការបញ្ចេញសំឡេង ការផ្លាស់ប្តូរទៅរដ្ឋដែលបានផ្តល់ឱ្យ និងការវាយតម្លៃលទ្ធភាពពីគំរូភាសា។ សមាសភាគទីពីរត្រូវបានគណនាដោយឡែកពីគ្នាសម្រាប់ស៊ុមជាក់លាក់មួយ: នេះគឺជាទម្ងន់សូរស័ព្ទនៃ senon ដែលត្រូវនឹងនិមិត្តសញ្ញាបញ្ចូលនៃធ្នូនៅក្នុងសំណួរ។ ការឌិកូដកើតឡើងក្នុងពេលវេលាជាក់ស្តែង ដូច្នេះមិនមែនអ្វីៗទាំងអស់ត្រូវបានពិនិត្យនោះទេ។ វិធីដែលអាចធ្វើបាន៖ heuristics ពិសេសកំណត់សំណុំនៃសម្មតិកម្មទៅនឹងអ្វីដែលទំនងបំផុត។

ជាការពិតណាស់ផ្នែកដែលគួរឱ្យចាប់អារម្មណ៍បំផុតពីទស្សនៈបច្ចេកទេសគឺការសាងសង់ម៉ាស៊ីនស្វ័យប្រវត្តិបែបនេះ។ បញ្ហានេះត្រូវបានដោះស្រាយក្រៅបណ្តាញ។ ដើម្បីផ្លាស់ទីពី HMMs សាមញ្ញសម្រាប់ phoneme ដែលប្រកាន់យកបរិបទនីមួយៗទៅជា automata លីនេអ៊ែរសម្រាប់ពាក្យនីមួយៗ យើងត្រូវប្រើវចនានុក្រមបញ្ចេញសំឡេង។ ការបង្កើតវចនានុក្រមបែបនេះគឺមិនអាចទៅរួចទេដោយដៃ ហើយវិធីសាស្ត្រត្រូវបានប្រើប្រាស់នៅទីនេះ ការរៀនម៉ាស៊ីន(ហើយភារកិច្ចខ្លួនឯង សហគមន៍វិទ្យាសាស្ត្រហៅថា Grapheme-To-Phoneme ឬ G2P)។ នៅក្នុងវេន ពាក្យត្រូវបាន "ភ្ជាប់គ្នា" ជាមួយគ្នាទៅជាគំរូភាសា បង្ហាញក្នុងទម្រង់ផងដែរ។ ម៉ាស៊ីនរដ្ឋកំណត់. ប្រតិបត្តិការកណ្តាលនៅទីនេះគឺជាសមាសភាព WFST ប៉ុន្តែក៏សំខាន់ផងដែរ។ វិធីសាស្រ្តផ្សេងៗបង្កើនប្រសិទ្ធភាព WFST សម្រាប់ទំហំ និងប្រសិទ្ធភាពការផ្ទុក។

លទ្ធផលនៃដំណើរការឌិកូដគឺជាបញ្ជីសម្មតិកម្មដែលអាចត្រូវបានដំណើរការបន្ថែមទៀត។ ជាឧទាហរណ៍ អ្នកអាចប្រើគំរូភាសាដែលមានថាមពលខ្លាំងជាងមុន ដើម្បីដាក់ចំណាត់ថ្នាក់ឡើងវិញនូវសម្មតិកម្មដែលទំនងបំផុត។ បញ្ជីលទ្ធផលត្រូវបានប្រគល់ជូនអ្នកប្រើប្រាស់វិញ ដោយតម្រៀបតាមតម្លៃទំនុកចិត្ត - កម្រិតដែលយើងជឿជាក់ថាការទទួលស្គាល់ត្រូវបានអនុវត្តត្រឹមត្រូវ។ ជាញឹកញាប់មានសម្មតិកម្មមួយនៅសល់ ក្នុងករណីនេះកម្មវិធីអតិថិជនភ្លាមៗបន្តប្រតិបត្តិពាក្យបញ្ជាសំឡេង។

សរុបសេចក្តី អនុញ្ញាតឱ្យយើងនិយាយអំពីបញ្ហានៃរង្វាស់គុណភាពសម្រាប់ប្រព័ន្ធទទួលស្គាល់ការនិយាយ។ មាត្រដ្ឋានដែលពេញនិយមបំផុតគឺអត្រាកំហុសពាក្យ (និងបញ្ច្រាសរបស់វា ភាពត្រឹមត្រូវនៃពាក្យ) ។ សំខាន់ វាឆ្លុះបញ្ចាំងពីសមាមាត្រនៃពាក្យដែលទទួលស្គាល់មិនត្រឹមត្រូវ។ ដើម្បីគណនាអត្រាកំហុសពាក្យសម្រាប់ប្រព័ន្ធទទួលស្គាល់ការនិយាយ សាកសពដែលមានស្លាកដោយដៃនៃសំណួរជាសំឡេងដែលត្រូវគ្នានឹងប្រធានបទនៃកម្មវិធីដោយប្រើការសម្គាល់ការនិយាយត្រូវបានប្រើ។

SpeechKit Cloud គឺជាកម្មវិធីដែលផ្តល់ឱ្យអ្នកអភិវឌ្ឍន៍ចូលទៅកាន់ការទទួលស្គាល់ការនិយាយ និងបច្ចេកវិទ្យាសំយោគ Yandex ។ ការរួមបញ្ចូលត្រូវបានអនុវត្តដោយប្រើម៉ូឌុល Yandex TTS ដែលអាចរកបានតាមរយៈប្រព័ន្ធ MajorDoMo Add-ons Market ។

ដំណើរការដំឡើង និងកំណត់រចនាសម្ព័ន្ធគឺសាមញ្ញណាស់ ហើយត្រូវបានបញ្ចប់ក្នុងជំហានជាច្រើន។

1. ចូលទៅកាន់ផ្ទាំងបញ្ជា

2. ចូលទៅកាន់ទីផ្សារ Add-ons

3. ចូលទៅកាន់ផ្នែក "អន្តរកម្ម"

4. បន្ថែមម៉ូឌុលមួយទៅប្រព័ន្ធ MajorDomo - ផ្ទាំងបញ្ជា - ទីផ្សារកម្មវិធីបន្ថែម - អន្តរកម្ម - Yandex TTS - បន្ថែម:

5. ប្រព័ន្ធនឹងជូនដំណឹងដល់យើងអំពីការដំឡើងជោគជ័យ និងបញ្ជូនបន្តទៅកាន់ទំព័រ "ទីផ្សារបន្ថែម"៖

6. ដើម្បីកំណត់រចនាសម្ព័ន្ធម៉ូឌុលបន្ថែមទៀត អ្នកត្រូវការ Yandex Api Key ដែលអាចទទួលបានដោយឥតគិតថ្លៃនៅក្នុងគណនីរបស់អ្នកអភិវឌ្ឍន៍ដោយប្រើដែលមានស្រាប់។ គណនី Yandex៖

7. កំណត់ឈ្មោះទៅកូនសោដែលកំពុងបង្កើត ហើយចុច SpeechKit Cloud៖

8. បំពេញក្នុងវាលដែលត្រូវការជាមួយទិន្នន័យ ហើយចុចប៊ូតុង "ដាក់ស្នើ"៖

9. ប្រសិនបើអ្វីៗគ្រប់យ៉ាងត្រូវបានធ្វើបានត្រឹមត្រូវ សោ API ដែលបានបង្កើតនឹងបង្ហាញក្នុងបញ្ជីនៅខាងស្តាំ ដែលត្រូវតែចម្លងទៅក្ដារតម្បៀតខ្ទាស់៖

10. បើកការកំណត់នៃម៉ូឌុល Yantex TTS (MajorDoMo - ផ្ទាំងបញ្ជា - កម្មវិធី - Yandex TTS) នៅក្នុងវាល API-key បិទភ្ជាប់គន្លឹះដែលបានចម្លងក្នុងជំហានមុន ជ្រើសរើសសំឡេង អារម្មណ៍ ហើយត្រូវប្រាកដថាម៉ូឌុល ត្រូវបានធ្វើឱ្យសកម្ម៖

11. ការដំឡើងបានបញ្ចប់!

យកចិត្តទុកដាក់!ការធ្វើតេស្ត Yandex Api Key ត្រូវបានបង្កើតសម្រាប់រយៈពេល 1 ខែ បន្ទាប់ពីនោះប្រព័ន្ធនឹងបញ្ឈប់ការបញ្ចេញឃ្លាថ្មី (មិនមានឃ្លាំងសម្ងាត់)។ ដើម្បីទទួលបានកូនសោអចិន្រ្តៃយ៍ អ្នកត្រូវតែផ្ញើលិខិតមួយទៅ Yandex ជាមួយនឹងសំណើផ្ទេរសោទៅលេខអចិន្ត្រៃយ៍។

បច្ចេកវិទ្យាទទួលស្គាល់ការនិយាយ

Yandex Speechkit Autopoet ។

កំពុងរៀបចំអត្ថបទ

ការបញ្ចេញសំឡេង និងការបញ្ចេញសំឡេង

ទំព័រ ឬនៅលើគេហទំព័រធនធានពិសេស

អ្នកទាំងអស់គ្នាប្រហែលជាមានឱកាសគ្រប់គ្រងកុំព្យូទ័រ ឬស្មាតហ្វូនដោយប្រើសំឡេងរបស់អ្នក។ នៅពេលអ្នកប្រាប់អ្នករុករកថា "តោះទៅ Gogol, 25" ឬនិយាយនៅក្នុងកម្មវិធី Yandex សំណួរស្វែងរកបច្ចេកវិទ្យាសម្គាល់ការនិយាយបំប្លែងសំឡេងរបស់អ្នកទៅជាពាក្យបញ្ជាអត្ថបទ។ ប៉ុន្តែក៏មានដែរ។ បញ្ហាបញ្ច្រាស៖ បង្វែរអត្ថបទដែលកុំព្យូទ័រមាននៅនឹងខ្លួនទៅជាសំឡេង។

Yandex ប្រើបច្ចេកវិទ្យាសំយោគការនិយាយពីស្មុគស្មាញ Yandex Speechkit ទៅអត្ថបទជាសំឡេង។ ឧទាហរណ៍ វាអនុញ្ញាតឱ្យអ្នកស្វែងយល់ពីរបៀបបញ្ចេញសំឡេង ពាក្យបរទេសនិងឃ្លានៅក្នុងអ្នកបកប្រែ។ សូមអរគុណដល់ការសំយោគការនិយាយ Autopoet ក៏ទទួលបានសំលេងផ្ទាល់ខ្លួនរបស់គាត់ផងដែរ។

កំពុងរៀបចំអត្ថបទ

ការបញ្ចេញសំឡេង និងការបញ្ចេញសំឡេង

ម្យ៉ាងវិញទៀត ទិន្នន័យជាច្រើនត្រូវបានប្រើដើម្បីសំយោគរាល់ 25 មីលីវិនាទីនៃការនិយាយ។ ព័ត៌មានអំពីបរិយាកាសភ្លាមៗធានាឱ្យមានការផ្លាស់ប្តូរដោយរលូនពីស៊ុមមួយទៅស៊ុមមួយ និងពីព្យាង្គទៅព្យាង្គ ហើយព័ត៌មានអំពីឃ្លា និងប្រយោគទាំងមូលគឺចាំបាច់ដើម្បីបង្កើត សំឡេងត្រឹមត្រូវ។ការនិយាយសំយោគ។

គំរូសូរស័ព្ទត្រូវបានប្រើដើម្បីអានអត្ថបទដែលបានរៀបចំ។ វាខុសគ្នាពីគំរូសូរស័ព្ទដែលត្រូវបានប្រើក្នុងការទទួលស្គាល់ការនិយាយ។ ក្នុងករណីនៃការទទួលស្គាល់គំរូ វាជាការចាំបាច់ក្នុងការបង្កើតការឆ្លើយឆ្លងរវាងសំឡេងដែលមានលក្ខណៈជាក់លាក់ និងសូរសព្ទ។ នៅក្នុងករណីនៃការសំយោគ, គំរូសូរស័ព្ទ, នៅលើផ្ទុយមកវិញ, ត្រូវតែ, ដោយផ្អែកលើការពិពណ៌នានៃស៊ុម, បង្កើតការពិពណ៌នានៃសំឡេង។

តើគំរូសូរស័ព្ទដឹងពីរបៀបបញ្ចេញសំឡេងសូរសព្ទត្រឹមត្រូវ ឬបញ្ចេញសំឡេងត្រឹមត្រូវដោយរបៀបណា? ប្រយោគសួរចម្លើយ? នាងរៀនពីអត្ថបទ និងឯកសារសំឡេង។ ឧទាហរណ៍ អ្នកអាចផ្ទុកសៀវភៅអូឌីយ៉ូ និងអត្ថបទដែលត្រូវគ្នាទៅក្នុងវា។ ទិន្នន័យកាន់តែច្រើនដែលគំរូរៀនពី ការបញ្ចេញសំឡេង និងសំឡេងរបស់វាកាន់តែប្រសើរ។

ព័ត៌មានបន្ថែមអំពីបច្ចេកវិទ្យាពីស្មុគស្មាញ Yandex SpeechKit អាចរកបាននៅលើទំព័រនេះ ឬនៅលើធនធានពិសេស។ ប្រសិនបើអ្នកជាអ្នកអភិវឌ្ឍន៍ ហើយចង់សាកល្បង cloud ឬ កំណែចល័ត SpeechKit ដែលជាគេហទំព័រឧទ្ទិសដល់បច្ចេកវិទ្យា Yandex នឹងជួយអ្នក។

",contentType":"text/html","amp":"

អ្នកទាំងអស់គ្នាប្រហែលជាមានឱកាសគ្រប់គ្រងកុំព្យូទ័រ ឬស្មាតហ្វូនដោយប្រើសំឡេងរបស់អ្នក។ នៅពេលអ្នកប្រាប់ Navigator "Let's go to Gogol, 25" ឬនិយាយសំណួរស្វែងរកនៅក្នុងកម្មវិធី Yandex បច្ចេកវិទ្យាសម្គាល់ការនិយាយបំប្លែងសំឡេងរបស់អ្នកទៅជាពាក្យបញ្ជាអត្ថបទ។ ប៉ុន្តែក៏មានកិច្ចការផ្ទុយគ្នាផងដែរ៖ ដើម្បីបង្វែរអត្ថបទដែលកុំព្យូទ័រមាននៅក្នុងការចោលទៅជាសំឡេង។

ប្រសិនបើសំណុំនៃអត្ថបទដែលត្រូវបញ្ចេញសំឡេងគឺតូច ហើយកន្សោមដូចគ្នាត្រូវបានរកឃើញនៅក្នុងពួកគេ - ឧទាហរណ៍ នៅក្នុងការប្រកាសអំពីការចាកចេញ និងការមកដល់នៃរថភ្លើងនៅស្ថានីយ៍ - វាគ្រប់គ្រាន់ក្នុងការអញ្ជើញវាគ្មិន និងកត់ត្រានៅក្នុង ស្ទូឌីយោ ពាក្យត្រឹមត្រូវ។និងឃ្លា ហើយបន្ទាប់មកប្រមូលផ្តុំសារពីពួកគេ។ ទោះជាយ៉ាងណាក៏ដោយវិធីសាស្រ្តនេះមិនដំណើរការជាមួយអត្ថបទបំពានទេ។ នេះគឺជាកន្លែងដែលបច្ចេកវិទ្យាសំយោគការនិយាយចូលមកងាយស្រួល។

Yandex ប្រើបច្ចេកវិទ្យាសំយោគការនិយាយពីស្មុគស្មាញ Yandex Speechkit ទៅអត្ថបទជាសំឡេង។ ជាឧទាហរណ៍ វាអនុញ្ញាតឱ្យអ្នកស្វែងយល់ពីរបៀបដែលពាក្យ និងឃ្លាបរទេសត្រូវបានបញ្ចេញនៅក្នុងអ្នកបកប្រែ។ សូមអរគុណដល់ការសំយោគការនិយាយ Autopoet ក៏ទទួលបានសំលេងផ្ទាល់ខ្លួនរបស់គាត់ផងដែរ។

កំពុងរៀបចំអត្ថបទ

បញ្ហានៃការសំយោគការនិយាយត្រូវបានដោះស្រាយក្នុងដំណាក់កាលជាច្រើន។ ទីមួយ ក្បួនដោះស្រាយពិសេសរៀបចំអត្ថបទដើម្បីឱ្យវាងាយស្រួលសម្រាប់មនុស្សយន្តក្នុងការអានវា៖ វាសរសេរលេខទាំងអស់ជាពាក្យ និងពង្រីកអក្សរកាត់។ បន្ទាប់មកអត្ថបទត្រូវបានបែងចែកទៅជាឃ្លា នោះគឺជាឃ្លាដែលមានសំឡេងបន្ត - សម្រាប់នេះ កុំព្យូទ័រផ្តោតលើសញ្ញាវណ្ណយុត្តិ និងរចនាសម្ព័ន្ធស្ថេរភាព។ សម្រាប់ពាក្យទាំងអស់វាត្រូវបានចងក្រង ការចម្លងតាមសូរសព្ទ.

ដើម្បីយល់ពីរបៀបអានពាក្យមួយ និងកន្លែងដែលត្រូវដាក់ការសង្កត់ធ្ងន់នៅក្នុងវា មនុស្សយន្តដំបូងបានងាកទៅរកវចនានុក្រមដែលចងក្រងដោយដៃបុរាណដែលត្រូវបានបង្កើតឡើងនៅក្នុងប្រព័ន្ធ។ ប្រសិនបើពាក្យដែលត្រូវការមិនមាននៅក្នុងវចនានុក្រមទេ កុំព្យូទ័របង្កើតប្រតិចារិកដោយខ្លួនឯង - ផ្អែកលើច្បាប់ដែលបានខ្ចីពី សៀវភៅយោងសិក្សា. ទីបំផុតប្រសិនបើ ច្បាប់ធម្មតា។វាប្រែថាមិនគ្រប់គ្រាន់ - ហើយរឿងនេះកើតឡើងដោយសារតែភាសារស់នៅណាមួយកំពុងផ្លាស់ប្តូរជានិច្ច - វាប្រើ ច្បាប់ស្ថិតិ. ប្រសិនបើពាក្យនេះបានលេចឡើងនៅក្នុងសាកសព អត្ថបទបណ្តុះបណ្តាលប្រព័ន្ធនឹងចងចាំព្យាង្គណាមួយដែលអ្នកនិយាយជាធម្មតាសង្កត់ធ្ងន់។

ការបញ្ចេញសំឡេង និងការបញ្ចេញសំឡេង

នៅពេលដែលប្រតិចារិករួចរាល់ កុំព្យូទ័រនឹងគណនារយៈពេលដែល phoneme នីមួយៗនឹងបន្លឺឡើង នោះគឺថាតើវាមានស៊ុមប៉ុន្មាន - នេះគឺជាអ្វីដែលបំណែកដែលមានប្រវែង 25 មិល្លីវិនាទីត្រូវបានគេហៅថា។ បន្ទាប់មកស៊ុមនីមួយៗត្រូវបានពិពណ៌នាយោងទៅតាមប៉ារ៉ាម៉ែត្រជាច្រើន: តើ phoneme វាជាផ្នែកមួយនៃអ្វីនិងកន្លែងដែលវាកាន់កាប់នៅក្នុងវា; តើសូរស័ព្ទនេះជារបស់ព្យាង្គអ្វី? បើវាជាស្រៈ តើវាតានតឹងទេ? តើកន្លែងណាដែលវាកាន់កាប់ក្នុងព្យាង្គ; ព្យាង្គ - នៅក្នុងពាក្យមួយ; ពាក្យ - នៅក្នុងឃ្លាមួយ; តើសញ្ញាវណ្ណយុត្តិមានអ្វីខ្លះមុន និងក្រោយឃ្លានេះ; តើឃ្លាកាន់កាប់កន្លែងណានៅក្នុងប្រយោគ; ទីបំផុត តើសញ្ញាអ្វីនៅចុងបញ្ចប់នៃប្រយោគ និងអ្វីដែលជាសំឡេងសំខាន់របស់វា។

ម្យ៉ាងវិញទៀត ទិន្នន័យជាច្រើនត្រូវបានប្រើដើម្បីសំយោគរាល់ 25 មីលីវិនាទីនៃការនិយាយ។ ព័ត៌មានអំពីបរិយាកាសភ្លាមៗធានានូវការផ្លាស់ប្តូរដោយរលូនពីស៊ុមមួយទៅស៊ុមមួយ និងពីព្យាង្គទៅព្យាង្គ ហើយព័ត៌មានអំពីឃ្លា និងប្រយោគទាំងមូលគឺចាំបាច់ដើម្បីបង្កើតសំឡេងត្រឹមត្រូវនៃសុន្ទរកថាដែលបានសំយោគ។

តើគំរូសូរស័ព្ទដឹងពីរបៀបបញ្ចេញសំឡេងសូរសព្ទបានត្រឹមត្រូវ ឬផ្តល់សំឡេងត្រឹមត្រូវដល់ប្រយោគសួរចម្លើយដោយរបៀបណា? នាងរៀនពីអត្ថបទ និងឯកសារសំឡេង។ ឧទាហរណ៍ អ្នកអាចផ្ទុកសៀវភៅអូឌីយ៉ូ និងអត្ថបទដែលត្រូវគ្នាទៅក្នុងវា។ ទិន្នន័យកាន់តែច្រើនដែលគំរូរៀនពី ការបញ្ចេញសំឡេង និងសំឡេងរបស់វាកាន់តែប្រសើរ។

ទីបំផុតអំពីសំឡេងខ្លួនឯង។ អ្វីដែលធ្វើឱ្យសំឡេងរបស់យើងអាចស្គាល់បាន ជាដំបូងគឺសំឡេងដែលអាស្រ័យលើលក្ខណៈរចនាសម្ព័ន្ធនៃសរីរាង្គ។ ឧបករណ៍និយាយមនុស្សគ្រប់រូប។ timbre នៃសំលេងរបស់អ្នកអាចត្រូវបានយកគំរូតាម នោះគឺជាលក្ខណៈរបស់វាអាចត្រូវបានពិពណ៌នា - ដើម្បីធ្វើដូចនេះវាគ្រប់គ្រាន់ក្នុងការអានអត្ថបទតូចមួយនៅក្នុងស្ទូឌីយោ។ បន្ទាប់ពីនេះ ទិន្នន័យអំពី timbre របស់អ្នកអាចត្រូវបានប្រើដើម្បីសំយោគការនិយាយជាភាសាណាមួយ សូម្បីតែមួយដែលអ្នកមិនដឹងក៏ដោយ។ នៅពេលដែលមនុស្សយន្តត្រូវការប្រាប់អ្នកពីអ្វីមួយ វាប្រើម៉ាស៊ីនភ្លើង រលកសំឡេង- សំឡេង។ វាមានព័ត៌មានអំពី លក្ខណៈប្រេកង់ឃ្លាដែលទទួលបានពីគំរូសូរស័ព្ទ ក៏ដូចជាទិន្នន័យនៅលើ timbre ដែលផ្តល់ឱ្យសំឡេងនូវពណ៌ដែលអាចស្គាល់បាន។

ព័ត៌មានបន្ថែមអំពីបច្ចេកវិទ្យាពីស្មុគស្មាញ Yandex SpeechKit អាចរកបាននៅលើទំព័រនេះ ឬនៅលើធនធានពិសេស។ ប្រសិនបើអ្នកជាអ្នកអភិវឌ្ឍន៍ ហើយចង់សាកល្បង cloud ឬ mobile version of SpeechKit នោះគេហទំព័រដែលឧទ្ទិសដល់បច្ចេកវិទ្យា Yandex នឹងជួយអ្នក។

""អត្ថបទបន្ទាន់":"

ប្រសិនបើសំណុំនៃអត្ថបទដែលត្រូវបញ្ចេញសំឡេងគឺតូច ហើយពួកវាមានកន្សោមដូចគ្នា - ឧទាហរណ៍នៅក្នុងសេចក្តីប្រកាសអំពីការចេញដំណើរ និងការមកដល់នៃរថភ្លើងនៅស្ថានីយ៍ - វាគ្រប់គ្រាន់ក្នុងការអញ្ជើញអ្នកនិយាយ កត់ត្រាពាក្យចាំបាច់។ និងឃ្លានៅក្នុងស្ទូឌីយោ ហើយបន្ទាប់មកប្រមូលសាររបស់ពួកគេ។ ទោះជាយ៉ាងណាក៏ដោយវិធីសាស្រ្តនេះមិនដំណើរការជាមួយអត្ថបទបំពានទេ។ នេះគឺជាកន្លែងដែលបច្ចេកវិទ្យាសំយោគការនិយាយចូលមកងាយស្រួល។

កំពុងរៀបចំអត្ថបទ

បញ្ហានៃការសំយោគការនិយាយត្រូវបានដោះស្រាយក្នុងដំណាក់កាលជាច្រើន។ ទីមួយ ក្បួនដោះស្រាយពិសេសរៀបចំអត្ថបទដើម្បីឱ្យវាងាយស្រួលសម្រាប់មនុស្សយន្តក្នុងការអានវា៖ វាសរសេរលេខទាំងអស់ជាពាក្យ និងពង្រីកអក្សរកាត់។ បន្ទាប់មកអត្ថបទត្រូវបានបែងចែកទៅជាឃ្លា នោះគឺជាឃ្លាដែលមានសំឡេងបន្ត - សម្រាប់នេះ កុំព្យូទ័រផ្តោតលើសញ្ញាវណ្ណយុត្តិ និងរចនាសម្ព័ន្ធស្ថេរភាព។ ការចម្លងតាមសូរសព្ទត្រូវបានចងក្រងសម្រាប់គ្រប់ពាក្យ។

ដើម្បីយល់ពីរបៀបអានពាក្យមួយ និងកន្លែងដែលត្រូវដាក់ការសង្កត់ធ្ងន់នៅក្នុងវា មនុស្សយន្តដំបូងបានងាកទៅរកវចនានុក្រមដែលចងក្រងដោយដៃបុរាណដែលត្រូវបានបង្កើតឡើងនៅក្នុងប្រព័ន្ធ។ ប្រសិនបើពាក្យដែលត្រូវការមិនមាននៅក្នុងវចនានុក្រមទេ កុំព្យូទ័របង្កើតប្រតិចារិកដោយខ្លួនឯង ដោយផ្អែកលើច្បាប់ដែលបានខ្ចីពីសៀវភៅយោងសិក្សា។ ជាចុងក្រោយ ប្រសិនបើច្បាប់ធម្មតាមិនគ្រប់គ្រាន់ - ហើយរឿងនេះកើតឡើងដោយសារតែភាសារស់នៅណាមួយកំពុងផ្លាស់ប្តូរជានិច្ច - គាត់ប្រើច្បាប់ស្ថិតិ។ ប្រសិនបើពាក្យមួយត្រូវបានរកឃើញនៅក្នុង corpus នៃអត្ថបទបណ្តុះបណ្តាល ប្រព័ន្ធនឹងចងចាំព្យាង្គណាមួយដែលអ្នកនិយាយជាធម្មតាសង្កត់ធ្ងន់នៅក្នុងវា។

ការបញ្ចេញសំឡេង និងការបញ្ចេញសំឡេង

ទីបំផុតអំពីសំឡេងខ្លួនឯង។ អ្វីដែលធ្វើឱ្យសំឡេងរបស់យើងអាចសម្គាល់បាន ជាដំបូងគឺសំឡេងដែលអាស្រ័យលើលក្ខណៈរចនាសម្ព័ន្ធនៃសរីរាង្គនៃឧបករណ៍និយាយក្នុងមនុស្សម្នាក់ៗ។ timbre នៃសំលេងរបស់អ្នកអាចត្រូវបានយកគំរូតាម នោះគឺជាលក្ខណៈរបស់វាអាចត្រូវបានពិពណ៌នា - ដើម្បីធ្វើដូចនេះវាគ្រប់គ្រាន់ក្នុងការអានអត្ថបទតូចមួយនៅក្នុងស្ទូឌីយោ។ បន្ទាប់ពីនេះ ទិន្នន័យអំពី timbre របស់អ្នកអាចត្រូវបានប្រើដើម្បីសំយោគការនិយាយជាភាសាណាមួយ សូម្បីតែមួយដែលអ្នកមិនដឹងក៏ដោយ។ នៅពេលដែលមនុស្សយន្តត្រូវការប្រាប់អ្នកពីអ្វីមួយ វាប្រើម៉ាស៊ីនបង្កើតរលកសំឡេង - vocoder ។ ព័ត៌មានអំពីលក្ខណៈប្រេកង់នៃឃ្លាដែលទទួលបានពីគំរូសូរស័ព្ទត្រូវបានផ្ទុកទៅក្នុងវា ក៏ដូចជាទិន្នន័យអំពី timbre ដែលផ្តល់ឱ្យសំឡេងនូវពណ៌ដែលអាចស្គាល់បាន។

"),,"proposedBody":("ប្រភព":"

កំពុងរៀបចំអត្ថបទ

បញ្ហានៃការសំយោគការនិយាយត្រូវបានដោះស្រាយក្នុងដំណាក់កាលជាច្រើន។ ទីមួយ ក្បួនដោះស្រាយពិសេសរៀបចំអត្ថបទដើម្បីឱ្យវាងាយស្រួលសម្រាប់មនុស្សយន្តក្នុងការអានវា៖ វាសរសេរលេខទាំងអស់ជាពាក្យ និងពង្រីកអក្សរកាត់។ បន្ទាប់មកអត្ថបទត្រូវបានបែងចែកទៅជាឃ្លា នោះគឺជាឃ្លាដែលមានសំឡេងបន្ត - សម្រាប់នេះ កុំព្យូទ័រផ្តោតលើសញ្ញាវណ្ណយុត្តិ និងសំណង់ដែលមានស្ថេរភាព។ ការចម្លងតាមសូរសព្ទត្រូវបានចងក្រងសម្រាប់គ្រប់ពាក្យ។

ដើម្បីយល់ពីរបៀបអានពាក្យមួយ និងកន្លែងដែលត្រូវដាក់ការសង្កត់ធ្ងន់នៅក្នុងវា មនុស្សយន្តដំបូងបានងាកទៅរកវចនានុក្រមដែលចងក្រងដោយដៃបុរាណដែលត្រូវបានបង្កើតឡើងនៅក្នុងប្រព័ន្ធ។ ប្រសិនបើពាក្យដែលត្រូវការមិនមាននៅក្នុងវចនានុក្រមទេ កុំព្យូទ័របង្កើតប្រតិចារិកដោយខ្លួនឯង ដោយផ្អែកលើច្បាប់ដែលបានខ្ចីពីសៀវភៅយោងសិក្សា។ ជាចុងក្រោយ ប្រសិនបើច្បាប់ធម្មតាមិនគ្រប់គ្រាន់ - ហើយរឿងនេះកើតឡើងដោយសារតែភាសារស់នៅណាមួយកំពុងផ្លាស់ប្តូរជានិច្ច - គាត់ប្រើច្បាប់ស្ថិតិ។ ប្រសិនបើពាក្យមួយត្រូវបានរកឃើញនៅក្នុង corpus នៃអត្ថបទបណ្តុះបណ្តាល ប្រព័ន្ធនឹងចងចាំព្យាង្គណាមួយដែលអ្នកនិយាយជាធម្មតាសង្កត់ធ្ងន់នៅក្នុងវា។

ការបញ្ចេញសំឡេង និងការបញ្ចេញសំឡេង

នៅពេលដែលប្រតិចារិករួចរាល់ កុំព្យូទ័រនឹងគណនារយៈពេលដែល phoneme នីមួយៗនឹងបន្លឺឡើង នោះគឺថាតើវាមានស៊ុមប៉ុន្មាន - នេះគឺជាអ្វីដែលបំណែកដែលមានប្រវែង 25 មិល្លីវិនាទីត្រូវបានគេហៅថា។ បន្ទាប់មកស៊ុមនីមួយៗត្រូវបានពិពណ៌នាយោងទៅតាមប៉ារ៉ាម៉ែត្រជាច្រើន: តើ phoneme វាជាផ្នែកមួយនៃអ្វីនិងកន្លែងដែលវាកាន់កាប់នៅក្នុងវា; តើសូរស័ព្ទនេះជារបស់ព្យាង្គអ្វី? ប្រសិនបើវាជាស្រៈ តើវាត្រូវបានសង្កត់ធ្ងន់; តើកន្លែងណាដែលវាកាន់កាប់ក្នុងព្យាង្គ; ព្យាង្គ - នៅក្នុងពាក្យមួយ; ពាក្យ - នៅក្នុងឃ្លាមួយ; តើសញ្ញាវណ្ណយុត្តិមានអ្វីខ្លះមុន និងក្រោយឃ្លានេះ; តើឃ្លាកាន់កាប់កន្លែងណានៅក្នុងប្រយោគ; ទីបំផុត តើសញ្ញាអ្វីនៅចុងបញ្ចប់នៃប្រយោគ និងអ្វីដែលជាសំឡេងសំខាន់របស់វា។

ទីបំផុតអំពីសំឡេងខ្លួនឯង។ អ្វីដែលធ្វើឱ្យសំឡេងរបស់យើងអាចសម្គាល់បាន ជាដំបូងគឺសំឡេងដែលអាស្រ័យលើលក្ខណៈរចនាសម្ព័ន្ធនៃសរីរាង្គនៃឧបករណ៍និយាយក្នុងមនុស្សម្នាក់ៗ។ Timbre នៃសំឡេងរបស់អ្នកអាចត្រូវបានយកគំរូតាម នោះគឺជាលក្ខណៈរបស់វាអាចត្រូវបានពិពណ៌នា - ដើម្បីធ្វើដូច្នេះគ្រាន់តែអានអត្ថបទតូចមួយនៅក្នុងស្ទូឌីយោ។ បន្ទាប់ពីនេះ ទិន្នន័យអំពី timbre របស់អ្នកអាចត្រូវបានប្រើដើម្បីសំយោគការនិយាយជាភាសាណាមួយ សូម្បីតែមួយដែលអ្នកមិនដឹងក៏ដោយ។ នៅពេលដែលមនុស្សយន្តត្រូវការប្រាប់អ្នកពីអ្វីមួយ វាប្រើម៉ាស៊ីនបង្កើតរលកសំឡេងហៅថា vocoder ។ ព័ត៌មានអំពីលក្ខណៈប្រេកង់នៃឃ្លាដែលទទួលបានពីគំរូសូរស័ព្ទត្រូវបានផ្ទុកទៅក្នុងវា ក៏ដូចជាទិន្នន័យអំពី timbre ដែលផ្តល់ឱ្យសំឡេងនូវពណ៌ដែលអាចស្គាល់បាន។

កំពុងរៀបចំអត្ថបទ

បញ្ហានៃការសំយោគការនិយាយត្រូវបានដោះស្រាយក្នុងដំណាក់កាលជាច្រើន។ ទីមួយ ក្បួនដោះស្រាយពិសេសរៀបចំអត្ថបទដើម្បីឱ្យវាងាយស្រួលសម្រាប់មនុស្សយន្តក្នុងការអានវា៖ វាសរសេរលេខទាំងអស់ជាពាក្យ និងពង្រីកអក្សរកាត់។ បន្ទាប់មកអត្ថបទត្រូវបានបែងចែកទៅជាឃ្លា នោះគឺជាឃ្លាដែលមានសំឡេងបន្ត - សម្រាប់នេះ កុំព្យូទ័រផ្តោតលើសញ្ញាវណ្ណយុត្តិ និងរចនាសម្ព័ន្ធស្ថេរភាព។ ការចម្លងតាមសូរសព្ទត្រូវបានចងក្រងសម្រាប់គ្រប់ពាក្យ។

ដើម្បីយល់ពីរបៀបអានពាក្យមួយ និងកន្លែងដែលត្រូវដាក់ការសង្កត់ធ្ងន់នៅក្នុងវា មនុស្សយន្តដំបូងបានងាកទៅរកវចនានុក្រមដែលចងក្រងដោយដៃបុរាណដែលត្រូវបានបង្កើតឡើងនៅក្នុងប្រព័ន្ធ។ ប្រសិនបើពាក្យដែលត្រូវការមិនមាននៅក្នុងវចនានុក្រមទេ កុំព្យូទ័របង្កើតប្រតិចារិកដោយខ្លួនឯង ដោយផ្អែកលើច្បាប់ដែលបានខ្ចីពីសៀវភៅយោងសិក្សា។ ជាចុងក្រោយ ប្រសិនបើច្បាប់ធម្មតាមិនគ្រប់គ្រាន់ - ហើយរឿងនេះកើតឡើងដោយសារតែភាសារស់នៅណាមួយកំពុងផ្លាស់ប្តូរជានិច្ច - គាត់ប្រើច្បាប់ស្ថិតិ។ ប្រសិនបើពាក្យមួយត្រូវបានរកឃើញនៅក្នុង corpus នៃអត្ថបទបណ្តុះបណ្តាល ប្រព័ន្ធនឹងចងចាំព្យាង្គណាមួយដែលអ្នកនិយាយជាធម្មតាសង្កត់ធ្ងន់នៅក្នុងវា។

ការបញ្ចេញសំឡេង និងការបញ្ចេញសំឡេង

","contentType":"text/html"),"authorId":"24151397","slug":"kak-eto-rabotaet-sintez-rechi","canEdit":false,"canComment":false," isBanned":false,"canPublish":false,"viewType":"minor","isDraft":false,"isOnModeration":false,"isOutdated":false,"isSubscriber":false,commentsCount":55, modificationDate":"ថ្ងៃអង្គារ ទី០៣ ខែមេសា ឆ្នាំ២០១៨ ម៉ោង១៨:៥៦:០០ GMT+0000 (UTC)","isAutoPreview":false,"showPreview":true,"approvedPreview":("ប្រភព":"

នៅពេលអ្នកប្រាប់ Navigator “Let's go to Gogol, 25” ឬនិយាយសំណួរស្វែងរកខ្លាំងៗ បច្ចេកវិទ្យាសម្គាល់ការនិយាយបំប្លែងសំឡេងរបស់អ្នកទៅជាពាក្យបញ្ជាអត្ថបទ។ ក៏មានកិច្ចការផ្ទុយគ្នាដែរ៖ ប្រែអត្ថបទទៅជាសំឡេង។ ពេលខ្លះវាគ្រប់គ្រាន់ក្នុងការអញ្ជើញអ្នកនិយាយ ហើយគ្រាន់តែសរសេរពាក្យ និងឃ្លាដែលចាំបាច់ ប៉ុន្តែវានឹងមិនដំណើរការជាមួយអត្ថបទដែលបំពាននោះទេ។ នេះគឺជាកន្លែងដែលបច្ចេកវិទ្យាសំយោគការនិយាយចូលមកងាយស្រួល។

","contentType":"text/html"),"proposedPreview":("ប្រភព":"

","contentType":"text/html"),"titleImage":("h32":("height":32,path":"/get-yablogs/47421/file_1475751201967/h32","width": 58,"fullPath":"https://avatars.mds.yandex.net/get-yablogs/47421/file_1475751201967/h32"),"major1000":("height":246,"path":"/get- yablogs/47421/file_1475751201967/major1000","width":444,"fullPath":"https://avatars.mds.yandex.net/get-yablogs/47421/file_14757512019670"orm" height":156,"path":"/get-yablogs/47421/file_1475751201967/major288","width":287,"fullPath":"https://avatars.mds.yandex.net/get-yablogs/47421 /file_1475751201967/major288"), "major300":("path":"/get-yablogs/47421/file_1475751201967/major300","fullPath":"https://avatars.mds.net/getyandex. 47421/file_1475751201967/major300","width":300,"height":150),,"major444":("path":"/get-yablogs/47421/file_1475751201967/"athfull4:https" // avatars.mds.yandex.net/get-yablogs/47421/file_1475751201967/major444","width":444,"height":246),"major900":("path":"/get-yablogs/47421 / file_1475751201967/major900","fullPath":"https://avatars.mds.yandex.net/get-yablogs/47421/file_1475751201967/major900","width":"444"), "min2": : ("path":"/get-yablogs/47421/file_1475751201967/minor288","fullPath":"https://avatars.mds.yandex.net/get-yablogs/47421/file_14757512019887","or" : 288,"height":160),,"orig":("height":246,path":"/get-yablogs/47421/file_1475751201967/orig","width":444,"fullPath":" https://avatars.mds.yandex.net/get-yablogs/47421/file_1475751201967/orig"), "touch288":("path":"/get-yablogs/47421/file_1475751201967/"fullPath", "https://avatars.mds.yandex.net/get-yablogs/47421/file_1475751201967/touch288","width":444,"height":246),,"touch444":("path":"/get -yablogs/ 47421/file_1475751201967/touch444","fullPath":"https://avatars.mds.yandex.net/get-yablogs/47421/file_1475751201967/touch444","width444",4424he""":4"width","444") "touch900" :("height":246,"path":"/get-yablogs/47421/file_1475751201967/touch900","width":444,"fullPath":"https://avatars.mds.yandex. net/get -yablogs/47421/file_1475751201967/touch900"),"w1000":("height":246,"path":"/get-yablogs/47421/file_1475751201967/wi4d"l:"athfull" " : " https://avatars.mds.yandex.net/get-yablogs/47421/file_1475751201967/w1000"),"w260h260":("កំពស់":246,"path":"/get-yablogs/47421/ file_1475751201967/w260h260 ","width":260,"fullPath":"https://avatars.mds.yandex.net/get-yablogs/47421/file_1475751201967/w260h260":"w260h260")," "path ":"/get-yablogs/47421/file_1475751201967/w260h360","width":260,"fullPath":"https://avatars.mds.yandex.net/get-yablogs/47421/file731201576 "), "w288":("height":156,"path":"/get-yablogs/47421/file_1475751201967/w288","width":282,"fullPath":"https://avatars.mds. yandex.net /get-yablogs/47421/file_1475751201967/w288"),"w288h160":("កំពស់":160,"path":"/get-yablogs/47421/file_1475751201981,w67/ "fullPath" :"https://avatars.mds.yandex.net/get-yablogs/47421/file_1475751201967/w288h160"),"w300":("height":162,"path":"/get-yablogs/ 47421/file_1475751201967 /w300","width":292,"fullPath":"https://avatars.mds.yandex.net/get-yablogs/47421/file_1475751201967/w30044":"w400":" :246, "path":"/get-yablogs/47421/file_1475751201967/w444","width":444,"fullPath":"https://avatars.mds.yandex.net/get-yablogs/47421/file_14759 /w444" ),"w900":("កំពស់":246,"path":"/get-yablogs/47421/file_1475751201967/w900","width":444,"fullPath":"https://avatars. mds.yandex .net/get-yablogs/47421/file_1475751201967/w900"),"major620":("path":"/get-yablogs/47421/file_1475751201967/majorlPath","sava":"full620", .mds. yandex.net/get-yablogs/47421/file_1475751201967/major620","width":444,"height":150)),,"tags":[("displayName":"Yandex technologies","slug ":"tekhnologii -yandeksa","url":"/blog/company? ?tag=tekhnologii-yandeksa"),("displayName":"តើវាដំណើរការយ៉ាងដូចម្តេច?","slug":"kak-eto-rabotaet","url":"/blog/company??tag=kak-eto - rabotaet")],"isModerator":false,"isTypography":false,metaDescription":"","metaKeywords":"","relatedTitle":"","isAutoRelated":false,"commentsEnabled":true , "url":"/blog/company/kak-eto-rabotaet-sintez-rechi","urlTemplate":"/blog/company/%slug%","fullBlogUrl":"https://yandex.ru/ blog /company","addCommentUrl":"/blog/createComment/company/kak-eto-rabotaet-sintez-rechi","updateCommentUrl":"/blog/updateComment/company/kak-eto-rabotaet-sintez-rechi" , "addCommentWithCaptcha":"/blog/createWithCaptcha/company/kak-eto-rabotaet-sintez-rechi","changeCaptchaUrl":"/blog/api/captcha/new","putImageUrl":"/blog/image/put " , "urlBlog":"/blog/company","urlEditPost":"/blog/57f4dd21ccb9760017cf4ccf/edit","urlSlug":"/blog/post/generateSlug","urlPublishPost":"/blog/57f4dd21ccb1976f4 " , "urlUnpublishPost":"/blog/57f4dd21ccb9760017cf4ccf/unpublish","urlRemovePost":"/blog/57f4dd21ccb9760017cf4ccf/removePost","urlDraft":"/blog/57f4dd21ccb9760017cf4ccf/removePost","urlDraft":"/blog/-company/-" , "urlDraftTemplate":"/blog/company/%slug%/draft","urlRemoveDraft":"/blog/57f4dd21ccb9760017cf4ccf/removeDraft","urlTagSuggest":"/blog/api/suggest/company","url " /blog/company","isAuthor":false,"subscribeUrl":"/blog/api/subscribe/57f4dd21ccb9760017cf4ccf","unsubscribeUrl":"/blog/api/unsubscribe/57f4dd21ccb7clogage"Pclogage"/ / company/57f4dd21ccb9760017cf4ccf/edit","urlForTranslate":"/blog/post/translate","urlRelateIssue":"/blog/post/updateIssue","urlUpdateTranslate":"/blog/post/updateTranslate","urlLoadTranslate" : "/blog/post/loadTranslate","urlTranslationStatus":"/blog/company/kak-eto-rabotaet-sintez-rechi/translationInfo","urlRelatedArticles":"/blog/api/relatedArticles/company/kak-eto - rabotaet-sintez-rechi","អ្នកនិពន្ធ":("id":"24151397","uid":("value":"24151397","lite":false,"hosted":false),"aliases ": ("13":"chistyakova"),"login":"amarantta","display_name":("name":"Sveta Chistyakova","avatar":("default":"24700/24151397-15660497" "ទទេ": មិនពិត)), "អាសយដ្ឋាន":" [អ៊ីមែលការពារ] ","defaultAvatar":"24700/24151397-15660497","imageSrc":"https://avatars.mds.yandex.net/get-yapic/24700/24151397-15660497/islands-middle","isYandexStaff true),"originalModificationDate":"2018-04-03T15:56:07.719Z","socialImage":("h32":("height":32,"path":"/get-yablogs/47421/file_1475751201967/ h32","width":58,fullPath":"https://avatars.mds.yandex.net/get-yablogs/47421/file_1475751201967/h32"),"major1000":("កម្ពស់":246," path":"/get-yablogs/47421/file_1475751201967/major1000","width":444,"fullPath":"https://avatars.mds.yandex.net/get-yablogs/47421/file_1475970120m/ "major288":("height":156,"path":"/get-yablogs/47421/file_1475751201967/major288","width":287,"fullPath":"https://avatars.mds.yandex. net/get-yablogs/47421/file_1475751201967/major288"), "major300":("path":"/get-yablogs/47421/file_1475751201967/major300","fullPath"https://fullPath"s. .net/get-yablogs/47421/file_1475751201967/major300","width":300,"height":150),,"major444":("path":"/get-yablogs/47421/file_14759475120", " fullPath":"https://avatars.mds.yandex.net/get-yablogs/47421/file_1475751201967/major444","width":444,"height":246),,"major900":("ផ្លូវ" :" /get-yablogs/47421/file_1475751201967/major900","fullPath":"https://avatars.mds.yandex.net/get-yablogs/47421/file_1475751201967/major90","ight:" ": 246),"minor288":("path":"/get-yablogs/47421/file_1475751201967/minor288","fullPath":"https://avatars.mds.yandex.net/get-yablogs/47421/ file_1475751201967/ minor288","width":288,"height":160),,"orig":("height":246,"path":"/get-yablogs/47421/file_1475751201967/orig","width" :444, "fullPath":"https://avatars.mds.yandex.net/get-yablogs/47421/file_1475751201967/orig"),"touch288":("path":"/get-yablogs/47421/file_14015765 /touch288", "fullPath":"https://avatars.mds.yandex.net/get-yablogs/47421/file_1475751201967/touch288","width":444,"height":246),,"touch444": ("ផ្លូវ" :"/get-yablogs/47421/file_1475751201967/touch444","fullPath":"https://avatars.mds.yandex.net/get-yablogs/47421/file_14757512019647","dow401967", 444,"height ":246),,"touch900":("height":246,"path":"/get-yablogs/47421/file_1475751201967/touch900","width":444,"fullPath":"https // avatars. "width": 444,"fullPath":"https://avatars.mds.yandex.net/get-yablogs/47421/file_1475751201967/w1000"),"w260h260":("កម្ពស់":246,"ផ្លូវ" :"/get- yablogs/47421/file_1475751201967/w260h260","width":260,"fullPath":"https://avatars.mds.yandex.net/get-yablogs/47421/file_147596075126/ w260h360":("height":246,"path":"/get-yablogs/47421/file_1475751201967/w260h360","width":260,"fullPath":"https://avatars.mds.yandex.net/ get-yablogs/47421 /file_1475751201967/w260h360"),"w288":("height":156,"path":"/get-yablogs/47421/file_1475751201967/w288","288","athfull" "https:// avatars.mds.yandex.net/get-yablogs/47421/file_1475751201967/w288"),"w288h160":("កំពស់":160,"path":"/get-yablogs/47427/file_120195 w288h160","width ":288,"fullPath":"https://avatars.mds.yandex.net/get-yablogs/47421/file_1475751201967/w288h160","w300":("កំពស់":162," path":"/ get-yablogs/47421/file_1475751201967/w300","width":292,"fullPath":"https://avatars.mds.yandex.net/get-yablogs/47421/file_1475757/w "w444": ("កំពស់":246,"ផ្លូវ":"/get-yablogs/47421/file_1475751201967/w444","width":444,"fullPath":"https://avatars.mds.yandex. net/get-yablogs /47421/file_1475751201967/w444"),"w900":("height":246,"path":"/get-yablogs/47421/file_1475751201967/w900",4"width" ":"https://avatars.mds.yandex.net/get-yablogs/47421/file_1475751201967/w900"),"major620":("path":"/get-yablogs/47421/file_14757512019620196620" fullPath":"https://avatars.mds.yandex.net/get-yablogs/47421/file_1475751201967/major620","width":444,"height":150)))))">

វាបន្ថែមគ្រឿងទេសខ្លះ ហើយប្រសិនបើខ្ញុំចាប់ផ្តើមពិសោធន៍ជាមួយម៉ាស៊ីនផ្សេងទៀត ខ្ញុំទទួលបាន hashtag #Bring BackDashka នៅក្នុងមតិយោបល់។ វាល្អណាស់ក្នុងការមើលទាំងអស់នេះ ប៉ុន្តែដំណើរការនេះមិននៅស្ងៀមទេ ហើយក្រុមហ៊ុនជាច្រើនកំពុងអភិវឌ្ឍបច្ចេកវិទ្យាផ្ទាល់ខ្លួនរបស់ពួកគេ។ ជាឧទាហរណ៍ ខ្ញុំចូលចិត្តសំឡេង ដែលពេលខ្លះខ្ញុំក៏ដាក់ចូលទៅក្នុងវីដេអូដែរ។

ថ្មីៗនេះខ្ញុំបានជួបស្មុគស្មាញមួយ។ បច្ចេកវិទ្យាការនិយាយ Yandex រួមទាំងការទទួលស្គាល់ការនិយាយ និងការសំយោគ ការធ្វើឱ្យសំឡេង និងការជ្រើសរើសវត្ថុន័យក្នុងអត្ថបទនិយាយ។ បច្ចេកវិទ្យានៃការនិយាយបានរៀនស្គាល់ការធ្វើឱ្យសកម្មជាសំឡេង ដោយមានជំនួយរបស់វា អ្នកអាចកត់ត្រាសារ SMS និងទុកកំណត់ត្រាដោយសំឡេង ដោយមិនចាំបាច់ប្រើក្តារចុច និងចូលដោយផ្ទាល់នូវផ្នែកខាងក្រោយដែលត្រូវបានប្រើដោយជោគជ័យនៅក្នុងកម្មវិធីទូរសព្ទ Yandex។ ឧទាហរណ៍ SpeechKit Mobile SDK អនុញ្ញាតឱ្យអ្នកបញ្ចូលការទទួលស្គាល់ការនិយាយ និងការសំយោគ ក៏ដូចជាការធ្វើឱ្យសកម្មសំឡេងរបស់ Yandex ចូលទៅក្នុង កម្មវិធីទូរស័ព្ទសម្រាប់ iOS, Android (បើក នៅពេលនេះរុស្ស៊ី អង់គ្លេស ទួរគី និង ភាសាអ៊ុយក្រែន) ឬ ទូរស័ព្ទវីនដូ(ភាសារុស្សី)។ ការគ្រប់គ្រងដោយសំឡេងនឹងធ្វើឱ្យកម្មវិធីរបស់អ្នកកាន់តែងាយស្រួលប្រើ ជាពិសេសប្រសិនបើអ្នកប្រើពេញដៃ។ ដោយមិនប៉ះអេក្រង់គាត់អាចហៅបាន។ មុខងារដែលចង់បានក្នុងប្រយោគមួយ។

ខ្ញុំតែងតែចាប់អារម្មណ៍នឹងបច្ចេកវិទ្យាសំយោគការនិយាយ ដែលអនុញ្ញាតឱ្យអ្នកបកប្រែអត្ថបទទៅជាការនិយាយ។ ខ្ញុំបានគូសវាសយ៉ាងរហ័សនូវអត្ថបទ បញ្ចេញសំឡេងវា (Milena TTS [រុស្ស៊ី]) ហើយដាក់វាចូលទៅក្នុងវីដេអូលើប្រធានបទណាមួយ។ វានឹងគួរឱ្យចាប់អារម្មណ៍ជាពិសេសសម្រាប់អ្នកប្រើប្រាស់ដែលមានបញ្ហាក្នុងការនិយាយ ឬអ្នកដែលដោយសារហេតុផលមួយចំនួនមានការខ្មាស់អៀនចំពោះសំឡេងរបស់ពួកគេ។

សំឡេងពី Yandex ហាក់ដូចជាដើម គួរឱ្យស្រលាញ់ និងងាយយល់ដោយត្រចៀកមនុស្ស ជាពិសេស សំឡេងបុរស zahar និង ermil ។ សំឡេងស្ត្រី jane, oksana, alyss និង omazh បានធ្វើឱ្យខ្ញុំភ័យខ្លាចយ៉ាងខ្លាំង ហើយតាមគំនិតរបស់ខ្ញុំ កុំឈានដល់កម្ពស់របស់ SuperDazhki ។ ដូច្នេះតើអ្នកអាចឮសំឡេងថ្មីនៅលើកុំព្យូទ័រនៅផ្ទះធម្មតាដោយរបៀបណា? ដើម្បីធ្វើដូចនេះខ្ញុំត្រូវវាយលុកអ៊ីនធឺណិតហើយដំណោះស្រាយត្រូវបានរកឃើញនៅក្នុងទម្រង់នៃស្គ្រីប។

1. ដំបូងយើងត្រូវចូលទៅកាន់ទំព័រ ហើយចុចលើប៊ូតុង "គណនីអ្នកអភិវឌ្ឍន៍"។

អ្នកចូលភ្លាមៗ គណនីផ្ទាល់ខ្លួនហើយចុចប៊ូតុង "ទទួលបាន" ។ បន្ទាប់មកចុចលើប៊ូតុង "SpeechKit Cloud"។

បំពេញវាលទាំងអស់ដែលមានសញ្ញាផ្កាយពណ៌ក្រហម ហើយចុចប៊ូតុង "ដាក់ស្នើ" ។

សោនឹងត្រូវបានទទួលភ្លាមៗ បន្ទាប់ពីនោះវាចាំបាច់ត្រូវចម្លង។

ឥឡូវយើងទៅកាន់វាដែលយើងនឹងឃើញប៉ារ៉ាម៉ែត្រសំណើផ្សេងៗ ឧបករណ៍បំពងសំឡេង (សំឡេងនិយាយសំយោគ) ទម្រង់ការឆ្លើយតប និងឧទាហរណ៍ URL។ អក្សរចិននេះនឹងហាក់ដូចជាស្មុគស្មាញពេកសម្រាប់អ្នកប្រើប្រាស់ជាមធ្យម ដូច្នេះយើងនឹងធ្វើឱ្យសកម្មភាពរបស់យើងសាមញ្ញ (ឬផ្ទុយទៅវិញធ្វើឱ្យពួកគេស្មុគស្មាញ) ដោយរៀបចំស្គ្រីបសាមញ្ញមួយ។

2. ទាញយកកម្មវិធី Notepad++ ទៅកាន់កុំព្យូទ័ររបស់អ្នក ()។ យើងដំឡើង។

3. បង្កើតឯកសារ index.html ។ ប្រសិនបើអ្នកមិនចង់បង្កើតវាដោយដៃទេ សូមទាញយកវានៅទីនេះ។

ប្តូរឈ្មោះឯកសារ៖ index.html ។ ប្រភេទឯកសារ៖ ឯកសារទាំងអស់។ ការអ៊ិនកូដ៖ UTF-8 ។ ចុចប៊ូតុង "រក្សាទុក" ។ វាមានសារៈសំខាន់ក្នុងការរក្សាទុកឯកសារ index.html នៅក្នុង root នៃដ្រាយប្រព័ន្ធ ឬនៅក្នុងថតណាមួយនៅលើដ្រាយប្រព័ន្ធ។

ឥឡូវនេះឯកសារដែលបានរក្សាទុកត្រូវកែសម្រួល។ បើកឯកសារដោយប្រើ Notepad ++ ។

តាមពិត នេះជាស្គ្រីបដែលយើងទន្ទឹងរង់ចាំជាយូរមកហើយ ()។ កែសម្រួលឯកសាររបស់អ្នកឱ្យបានត្រឹមត្រូវ៖ បិទភ្ជាប់ទៅក្នុង កន្លែងត្រឹមត្រូវ។សោរបស់អ្នក ផ្លាស់ប្តូរសំឡេងរបស់អ្នក រក្សាទុក និងប្រើប្រាស់។

បន្ទាប់មកចុចពីរដងលើឯកសារ index.html ហើយនៅក្នុងកម្មវិធីរុករកយើងទទួលបានដូចខាងក្រោម។

ទុកចោល បង្អួចធំសរសេរកំណាព្យមួយហើយ zahar (ឬតួអក្សរដែលបានជ្រើសរើសផ្សេងទៀត) នឹងអានវាឱ្យអ្នក។ ខ្ញុំមិនប្រកែកទេ វាអាចទៅរួចដែលខ្ញុំបានតម្រៀបវានៅទីនេះនៅលើធ្នើសម្រាប់គ្មាននរណាម្នាក់ ហើយនឹងមិនត្រូវការវានៅថ្ងៃស្អែក ខ្ញុំគ្រាន់តែចាប់អារម្មណ៍លើដំណើរការសំយោគការនិយាយពី Yandex នៅលើកុំព្យូទ័ររបស់ខ្ញុំ ដែលខ្ញុំបានចែករំលែកជាមួយ អ្នក.

ជួយគម្រោងក្នុងការអភិវឌ្ឍន៍របស់វា៖
កាត Sberbank: 676280139020834994
Yandex.Money: 410012054992141
Webmoney៖ កាបូប WMR R429054927097
WMZ-កាបូប Z401294377967