Mihalea Matei Conf. Dr. Ing. Andrei Olaru 04.07 · Recunoașterea vocii Sisteme cloud Bazate pe...

13
Agent Asistent Inteligent Prelucrarea și generarea vorbirii Mihalea Matei Conf. Dr. Ing. Andrei Olaru 04.07.2017 University Politehnica of Bucharest

Transcript of Mihalea Matei Conf. Dr. Ing. Andrei Olaru 04.07 · Recunoașterea vocii Sisteme cloud Bazate pe...

Page 1: Mihalea Matei Conf. Dr. Ing. Andrei Olaru 04.07 · Recunoașterea vocii Sisteme cloud Bazate pe efectuarea de deep-learning pe date masive Performanțe foarte bune Sisteme locale

Agent Asistent InteligentPrelucrarea și generarea vorbirii

Mihalea MateiConf. Dr. Ing. Andrei Olaru

04.07.2017

University Politehnica of Bucharest

Page 2: Mihalea Matei Conf. Dr. Ing. Andrei Olaru 04.07 · Recunoașterea vocii Sisteme cloud Bazate pe efectuarea de deep-learning pe date masive Performanțe foarte bune Sisteme locale

Introducere

• parte a proiectului Agent Asistent Inteligent

• are ca obiective implementarea unui asistent inteligent:

➔ local

➔ open-source

Page 3: Mihalea Matei Conf. Dr. Ing. Andrei Olaru 04.07 · Recunoașterea vocii Sisteme cloud Bazate pe efectuarea de deep-learning pe date masive Performanțe foarte bune Sisteme locale

Arhitectura proiectului

Page 4: Mihalea Matei Conf. Dr. Ing. Andrei Olaru 04.07 · Recunoașterea vocii Sisteme cloud Bazate pe efectuarea de deep-learning pe date masive Performanțe foarte bune Sisteme locale

Recunoașterea vocii● Sisteme cloud

➢ Bazate pe efectuarea de deep-learning pe date masive

➢ Performanțe foarte bune

● Sisteme locale➢ Permit utilizatorilor antrenarea și

folosirea propriilor modele➢ Dimensiunea datelor - limitată

Page 5: Mihalea Matei Conf. Dr. Ing. Andrei Olaru 04.07 · Recunoașterea vocii Sisteme cloud Bazate pe efectuarea de deep-learning pe date masive Performanțe foarte bune Sisteme locale

Recunoașterea vocii – State of the Art

● Sisteme cloud➢ Google Cloud Speech API➢ Microsoft Bing Voice Recognition➢ IBM Speech to Text

● Sisteme locale➢ Mozilla DeepSpeech➢ CMU Sphinx➢ Kaldi

Page 6: Mihalea Matei Conf. Dr. Ing. Andrei Olaru 04.07 · Recunoașterea vocii Sisteme cloud Bazate pe efectuarea de deep-learning pe date masive Performanțe foarte bune Sisteme locale

Recunoașterea vocii în cadrul proiectului

● Sphinx4● Mozilla DeepSpeech● Google Cloud Speech API

Page 7: Mihalea Matei Conf. Dr. Ing. Andrei Olaru 04.07 · Recunoașterea vocii Sisteme cloud Bazate pe efectuarea de deep-learning pe date masive Performanțe foarte bune Sisteme locale

Înregistrarea comenzilor utilizatorului

Am ales folosirea fișierelor:

✗ Viteză de execuție✔ Debugging✔ Persistență✔ Corectarea erorilor

✗ Viteză de execuție

Modalități de înregistrare:● Folosind un microfon● Înregistrarea de pe placa de sunet

Page 8: Mihalea Matei Conf. Dr. Ing. Andrei Olaru 04.07 · Recunoașterea vocii Sisteme cloud Bazate pe efectuarea de deep-learning pe date masive Performanțe foarte bune Sisteme locale

Corectarea erorilor

Page 9: Mihalea Matei Conf. Dr. Ing. Andrei Olaru 04.07 · Recunoașterea vocii Sisteme cloud Bazate pe efectuarea de deep-learning pe date masive Performanțe foarte bune Sisteme locale

Eliminarea zgomotului

• Scop

➔ Performanța aplicației în orice condiții

• Funcționare

1)Se creează profilul zgomotului

2)Pe baza profilului, se elimină zgomotul pentru tot fișierul

Page 10: Mihalea Matei Conf. Dr. Ing. Andrei Olaru 04.07 · Recunoașterea vocii Sisteme cloud Bazate pe efectuarea de deep-learning pe date masive Performanțe foarte bune Sisteme locale

GUI

1.Buton pentru începerea înregistrării2.Selectează durata înregistrării3.Selectează modalitatea de traducere / înregistrare fișier

4.Bară de status

Page 11: Mihalea Matei Conf. Dr. Ing. Andrei Olaru 04.07 · Recunoașterea vocii Sisteme cloud Bazate pe efectuarea de deep-learning pe date masive Performanțe foarte bune Sisteme locale

Rezultate - 1

Page 12: Mihalea Matei Conf. Dr. Ing. Andrei Olaru 04.07 · Recunoașterea vocii Sisteme cloud Bazate pe efectuarea de deep-learning pe date masive Performanțe foarte bune Sisteme locale

Rezultate - 2

Page 13: Mihalea Matei Conf. Dr. Ing. Andrei Olaru 04.07 · Recunoașterea vocii Sisteme cloud Bazate pe efectuarea de deep-learning pe date masive Performanțe foarte bune Sisteme locale

[email protected]

Thank you for your attention.