Vous n'êtes pas identifié(e).

  • Contributions :
  • Vos boîtes de messages privés sont vides.

#1 2014-06-03 17:55:15

Mention conquering_lion
Scout
Inscription : 2013-05-23
Messages : 204

Tuto : Ruby - s'amuser avec l'API de reconnaissance vocale google

Aussitôt dis, aussitôt fait. L'API google speech permet d'interagir avec de l'audio. Le gem est speech2text. Vous installez .. et ca se passe en 3 ligne smile

require 'speech'

audio = Speech::AudioToText.new("mon_fichier_audio.wav")    
puts audio.to_text

quoi ? Vous vous attendiez à plus compliqué ?? smile

Comme évoqué dans un autre post, ca ne marche pas pour les "spoken letters" .. et de toute façon, réaliser une appli dépendante d'une autre API ... bof bof (même si effectivement ca peut dépanner)..

voilà !

En ligne

#2 2014-06-03 18:07:00

Mention Jojo_le_haricot
Scout
Inscription : 2014-04-18
Messages : 461

Re : Tuto : Ruby - s'amuser avec l'API de reconnaissance vocale google

Quand je pense qu un nouveau membre qui c est inscrit hier faisait la promotion de transcription vocal vers text... Tu lui casse son biz la smile
Tu a une solution pour traiter des mp3 et 4 ?
Question de ce faire des articles sur une base youtube smile


----
Chili con seo

Hors ligne

#3 2014-06-03 18:08:26

Mention Jojo_le_haricot
Scout
Inscription : 2014-04-18
Messages : 461

Re : Tuto : Ruby - s'amuser avec l'API de reconnaissance vocale google

Merci pour l info en tout cas.
La moi je ressort de la gem paypal-recurente que je viens d integrer, c est moins fun que toi smile


----
Chili con seo

Hors ligne

#4 2014-06-03 18:11:04

Mention Jojo_le_haricot
Scout
Inscription : 2014-04-18
Messages : 461

Re : Tuto : Ruby - s'amuser avec l'API de reconnaissance vocale google

Concernant les spoken letter, pas moyen de lui rajouter un dico?


----
Chili con seo

Hors ligne

#5 2014-06-05 19:09:05

Mention conquering_lion
Scout
Inscription : 2013-05-23
Messages : 204

Re : Tuto : Ruby - s'amuser avec l'API de reconnaissance vocale google

yo !

g pas mal exploré le domain de l'audio et ruby en amont de mon truc
comme logiciel de reconnaissance en libre, tu as sphinx 4.. tu peux lui faire un dico tout ca .. mais ca à l'air assez complexe

pour mp3 mp4, si ya que de l'audio, tu peux tester le code tout là haut smile
moi j'ai réellement testé que sur mes bdd de training et de test

toute facon le réseau et son entrainement c'est pas le plus compliqué dans un truc comme ca, c'est plus la manière dont tu va transcire ton audio en données (vecteur) pour le passer au réseau (FFT, MFCC, LPC ... sont autant de manière de numériser de l'audio par ex)

enfin ya aussi la manière de classifier qui compte quand j'y réfléchis .. là je change mon fusil d'épaule et je vais entrainer le réseau à reconnaitre une seule lettre à la fois ..

PS un pti tuto sur l'utilisation du gem paypal récurrente en ruby ca peut être sympa smile

En ligne

Pied de page des forums