Tom's Guide > Forum > Programmation > Reconnaissance vocale
Mot :    Pseudo :           
 

Bonjour tout le monde!
Je suis actuellement en prépa scientifique, devant faire un TIPE, et j'ai choisi de m'intéresser à la reconnaissance vocale
Notre but serait en fait de créer un petit logiciel, de jeu par excemple, que l'on manoeuvrerait à l'aide de quelques commandes vocales...
Nous avons cherché des informations sur Internet mais sans grand succès...
Nous nous demandons déjà comment il serait possible d'intégrer le micro à un logiciel, d'exploiter le signal provenant du micro.
Nous aimerions aussi savoir si vous avez des informations sur la commande vocale, quelles sont les méthodes qui à notre échelle permettraient de distinguer le plus facilement possible quelques sons (du genre transformée de fourier, par exemple)
Merci!

Liens sponsorisés
Inscrivez-vous ou connectez-vous pour masquer ceci.

Bonjour,

Alors, je pense que tu vois un peu trop grand.
Voila dans quoi tu te lances :
1 jeu
2 outil pour récupérer le son micro
3 une analyse du signal.

Je te conseil de suivre les étapes suivantes :
1. enregistrer des sons en fichiers Wav avec sndrec32 (demarrer > exécuter > sndrec32)
2. faire ton outil pour analyser ces fichiers son. Là, google > reconnaissance vocale fourrier.
Tu dois pouvoir trouver des API qui ont déjà implémenter la transfo de fourrier, mais peut-être que le plus interessant est de la recoder.

Là, ce sont les deux étapes minimales pour pouvoir monter ton TIPE. Je te conseil de te concentrer dessus. Le reste est "optionnel".

3. Avec certaine api (google), tu dois pouvoir récupérer l'entrée micro. Là, tu peux lancer directement ton analyseur que tu as réalisé en étape 2 sur le signal que tu récupère en temps réelle. Ne se serait-ce qu'identifier les phonème récupérer serait bien.

4. Faire un jeu. Là, c'est une grosse partie. A mon avis, si tu fais juste une boule qui bouge en reconnaissant gauche/droit/haut/bas, ce sera bien dans le temps que tu as (je suppose que tu as d'autres cours qui ne sont pas facultatif).

quelques liens :
Java :
API de reconnaissance vocale
http://java.sun.com/products/java-media/speech/
Là, le gros du travail est déjà fait je pense (à vérifier).
tu peux faire un projet fake en disant que c'est toi qui a tout coder, mais bon... c'est un peu de la triche. sinon, tu dois pouvoir décompiler l'api et fouiller dedans. mais bon, tu vas perdre un temps précieux et ce n'est pas forcément la bonne démarche.

Comment récupérer l'entrée micro
http://www.developer.com/java/othe [...] 20Listings


C++/C# (microsoft)
API de reco vocale :
http://www.microsoft.com/speech/sp [...] fault.mspx

Comment récupérer l'entrée micro
http://www.csharpfriends.com/Forum [...] stID=44519

Autres :
Un article d'un gars qui a sans doute fait le même projet que toi
http://www.mperfect.net/noReco/


Mots clé pour les recherche google : "speech recognition", FFT, fourier, ...

Voila

------------------------------ Don't panic!
mouths91 à dit : "[...]des rageux comme kelnem"
Répondre à Vinz42

alors la, si il devient pas un pro grace à toi on n'y pourra plus rien ;)

Répondre à okinou

bah, sujet interessant, réponse intéressante.

ça change du :
question : ouech, g un blem avec mon sit lol
réponse : www.siteduzero.com + google stoo!

------------------------------ Don't panic!
mouths91 à dit : "[...]des rageux comme kelnem"
Répondre à Vinz42

Au fait, j'ai pensé à un jeu qui pourrait être sympa :
un petit DDR simplifié : http://fr.youtube.com/watch?v=6JzcqALklRs

 

tu fais défiler des flèches, et tu dois dire gauche/droit/haut/bas au moment où ça passe sur une ligne.

 

et tu peux inventer des mots à la con pour faire les combos, genre "bing", "bam" etc... lorsqu'il faut donner 2 flèche en meme temps.

 

ps : après, si on dit que je n'aide jamais...


Message édité par Vinz42 le 09-04-2008 à 10:34:39
------------------------------ Don't panic!
mouths91 à dit : "[...]des rageux comme kelnem"
Répondre à Vinz42

bon, un petit merci, des questions intelligentes ?

sinon, la prochaine fois, ce sera un "go to hell, motherfucker!"

------------------------------ Don't panic!
mouths91 à dit : "[...]des rageux comme kelnem"
Répondre à Vinz42

Waou merci énormément pour ta réponse ultra-complète!
Comme dit okinou, on devrait assurer avec ça maintenant.
C'est vrai que nous avions peut-être un peu trop d'ambition... au moins maintenant nous savons quoi utiliser et vers quoi nous lancer!
Désolé de pas avoir répondu plus tôt, je n'étais pas chez moi et je n'avais pas internet... et ce sera la même chose la semaine prochaine.
Encore merci, et bon week-end!

Répondre à popolmai
Tom's Guide > Forum > Programmation > Reconnaissance vocale
Aller à :

Il y a 1971 utilisateurs connus et inconnus. Pour voir la liste des connectés connus, cliquez ici.

Attention

Vous allez répondre sur un sujet resté inactif pendant plus de 6 mois.
Assurez-vous d'apporter des éléments nouveaux à la discussion avant de poursuivre.

Répondre Annuler
Liens