Abstract:
Un codeur de parole "LD-CELP" de débit 16 Kb/s et possédant un retard de codage inférieur à 2 ms a été réalisé. Cette réalisation a nécessité la prise en compte d'une taille réduite du vecteur d'analyse (5 échantillons) à traiter ainsi qu'une adaptation régressive du prédicteur LPC et du gain d'excitation. Le prédicteur pitch dans le CELP conventionnel est supprimé à cause de sa sensibilité aux erreurs du canal.
Pour compenser la perte de performance (surtout pour un signal de parole prononcé par un locuteur féminin), l'ordre de prédiction LPC est augmenté de 10 à 50. Cette modification permet au codeur d'être moins spécifique pour les signaux de parole. Deux types de dictionnaire sont utilisés pour la QV (Quantification Vectorielle) de l'excitation:
- Stochastique
- Algébrique
Le premier a été conçu par apprentissage (similaire à l'algorithme LBC) optimisé en boucle fermée en utilisant une base de donnée de signaux de parole.
Le deuxième a été conçu par l'utilisation d'un générateur de code ternaire. Une réduction significative de complexité a été obtenue en utilisant les caractéristiques du vecteur d'excitation ternaire. Les mesures objectives et subjectives montrent que la qualité de la parole synthétisée est de haute qualité pour les deux types d'excitations. Le travail a été extrapolé pour avoir un codeur de parole large bande (50 - 7000 Hz) à un faible retard (< 1 ms) à un débit de 32 Kb/s. Le signal de parole décodé possède une qualité transparente, mais la complexité du calcul se trouve pratiquement doublée. Le codeur LD-CELP à 16 Kb/s est utilisé dans les réseaux téléphoniques et peut être utilisé comme programme de compression de signaux de parole dans les supports de stockage.