Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision | ||
projects:iotaiuto:mycroft [2021/11/23 20:10] – daniel | projects:iotaiuto:mycroft [2021/12/15 13:10] (current) – daniel | ||
---|---|---|---|
Line 153: | Line 153: | ||
* Andare su https:// | * Andare su https:// | ||
- | ===== Addestramento di una rete neurale ===== | + | ==== Installazione |
- | + | ||
- | **ATTENZIONE**\\ | + | |
- | Usa questa parte di guida solo se vuoi addestrare manualmente una rete neurale | + | |
- | Se vuoi usare la rete neurale DeepSpeech italiana già addestrata, salta questa parte.\\ | + | |
- | A breve caricherò una versione addestrata della rete neurale aggiornata con il nuovo dataset CommonVoice di mozilla.\\ | + | |
- | + | ||
- | Requisiti: PC linux con scheda grafica nvidia | + | |
- | + | ||
- | Verificare se i driver nvidia sono installati: | + | |
- | < | + | |
- | nvidia-smi | + | |
- | </ | + | |
- | Questo comando dovrebbe mostrare una tabella con alcune proprietà della gpu | + | |
- | + | ||
- | Installare docker e nvidia-docker: | + | |
- | https:// | + | |
- | https:// | + | |
- | Prima di proseguire è consigliato fare un test per assicurarsi che docker riesca a vedere la gpu | + | |
- | + | ||
- | Scaricare il dataset più recente di CommonVoice\\ | + | |
- | https:// | + | |
- | + | ||
- | Dovrebbe essere un file chiamato it.tar.gz\\ | + | |
- | Estraetelo, rinominate la cartella " | + | |
- | Posizionate l' | + | |
- | < | + | |
- | cd $HOME | + | |
- | mkdir -p data/ | + | |
- | chmod a+rwx -R data | + | |
- | mv it.tar.gz data/ | + | |
- | chmod a+r data/ | + | |
- | </ | + | |
- | + | ||
- | === Creare l' | + | |
- | + | ||
- | < | + | |
- | cd $HOME | + | |
- | git clone MozillaItalia/ | + | |
- | + | ||
- | cd DeepSpeech-Italian-Model/ | + | |
- | </ | + | |
- | + | ||
- | Nella versione di DeepSpeech che stiamo usand sono presenti alcuni bug. Possiamo correggerli cambiando il file | + | |
- | " | + | |
- | con una versione modificata che trovate qui: | + | |
- | https:// | + | |
- | + | ||
- | < | + | |
- | chmod +x generate_base_dockerfile.sh | + | |
- | ./ | + | |
- | + | ||
- | docker build . -f Dockerfile.train -t deepspeech/ | + | |
- | docker build . -f Dockerfile_it.train -t deepspeech/ | + | |
- | </ | + | |
- | + | ||
- | + | ||
- | === Avviare l' | + | |
- | + | ||
- | < | + | |
- | docker run -e " | + | |
- | </ | + | |
- | Se non avete un supercomputer potrebbe essere necessario modificare | + | DeepSpeech è il motore STT di Mozilla\\ |
+ | Scaricare ed estrarre questo modello basato su DeepSpeech: | ||
+ | https:// | ||
- | Funzionante sul mio laptop con gpu 4gb: | ||
- | < | ||
- | docker run -e " | ||
- | </ | ||
- | Work in progress. | ||
- | |||
- | ==== Installazione DeepSpeech (pre addestrato) ==== | ||
- | |||
- | DeepSpeech è il motore STT di Mozilla\\ | ||
Dal terminale del raspberry: | Dal terminale del raspberry: | ||
< | < | ||
Line 236: | Line 168: | ||
mkdir deepspeech | mkdir deepspeech | ||
cd deepspeech | cd deepspeech | ||
- | curl -LO https:// | + | |
- | tar xvf transfer_model_tflite_it.tar.xz | + | # copiare in questa cartella il modello tflite e lo scorer scaricati |
- | rm transfer_model_tflite_it.tar.xz | + | |
git clone https:// | git clone https:// | ||
Line 247: | Line 179: | ||
</ | </ | ||
- | Aggiungere a config.json: | + | Aggiungere a config.json: |
< | < | ||
... | ... | ||
" | " | ||
- | " | + | " |
- | " | + | " |
}, | }, | ||
... | ... | ||
Line 301: | Line 233: | ||
**Work in progress** | **Work in progress** | ||
+ | |||
+ | ===== Addestramento manuale di una rete neurale ===== | ||
+ | |||
+ | **ATTENZIONE**\\ | ||
+ | Prosegui solo se non vuoi usare il modello già addestrato e vuoi addestrare manualmente una rete neurale DeepSpeech.\\ | ||
+ | |||
+ | Requisiti: PC Desktop con scheda grafica nvidia | ||
+ | Assicurarsi che il sistema operativo supporti CUDA 10.0.0. Non usare versioni più recenti di cuda. | ||
+ | (Testato con Ubuntu 18.04) | ||
+ | |||
+ | Verificare se i driver nvidia sono installati: | ||
+ | < | ||
+ | nvidia-smi | ||
+ | </ | ||
+ | Questo comando dovrebbe mostrare una tabella con alcune proprietà della gpu | ||
+ | |||
+ | Installare Cuda 10.0.0, potrebbe essere necessario disinstallare i driver nvidia e reinstallarli dopo cuda\\ | ||
+ | https:// | ||
+ | |||
+ | Installare docker e nvidia-docker: | ||
+ | https:// | ||
+ | https:// | ||
+ | Prima di proseguire è consigliato fare un test per assicurarsi che docker riesca a vedere la gpu | ||
+ | |||
+ | Scaricare il dataset più recente di CommonVoice\\ | ||
+ | https:// | ||
+ | |||
+ | Dovrebbe essere un file chiamato it.tar.gz\\ | ||
+ | Posizionate l' | ||
+ | < | ||
+ | cd $HOME | ||
+ | mkdir -p data/ | ||
+ | chmod a+rwx -R data | ||
+ | mv it.tar.gz data/ | ||
+ | chmod a+r data/ | ||
+ | </ | ||
+ | |||
+ | === Creare l' | ||
+ | |||
+ | Ho preso un tool di Mozilla-Italia che semplifica l' | ||
+ | < | ||
+ | cd $HOME | ||
+ | git clone https:// | ||
+ | cd DeepSpeech-Italian-Model/ | ||
+ | </ | ||
+ | |||
+ | < | ||
+ | chmod +x generate_base_dockerfile.sh | ||
+ | ./ | ||
+ | |||
+ | docker build . -f Dockerfile.train -t deepspeech/ | ||
+ | docker build . -f Dockerfile_it.train -t deepspeech/ | ||
+ | </ | ||
+ | |||
+ | |||
+ | === Avviare l' | ||
+ | |||
+ | < | ||
+ | docker run -e " | ||
+ | </ | ||
+ | |||
+ | Se il processo occupa troppa memoria della gpu potrebbe essere necessario ridurre il BATCH_SIZE, esempio: | ||
+ | < | ||
+ | docker run -e " | ||
+ | </ | ||
+ |