POTIONPerceptual Optimization of Time-Frequency Audio Representations and Coding

Le projet POTION vise à étudier des nouvelles représentations temps-fréquences perceptives des signaux audio, à étudier de manière exhaustive le phénomène de masquage perceptif temps-fréquence et à appliquer ce savoir à l’amélioration des codeurs audio compressifs.

Les objectifs de ce projet étaient d’étudier de nouvelles représentations temps-fréquences perceptives des signaux audio, d’étudier de manière exhaustive le phénomène de masquage perceptif temps-fréquence et d’appliquer ce savoir à l’amélioration des codeurs audio compressifs.

Une représentation optimale des signaux audio doit permettre de décrire l’information utile avec un minimum de données tout en suivant au plus près la perception auditive. Les représentations temps-fréquence actuelles (Gammatone, MDCT …) ne sont optimales que selon un seul aspect. Ce projet a pour but de répondre à :

  • Peut-on obtenir une classe de représentations temps-fréquence bien adaptées à la perception auditive ?
  • Peut-on rendre ces représentations inversible et non-redondante, ou a contrario fortement parcimonieuses ?
  • Peut-on améliorer les algorithmes de codage audio perceptif (type MP3) ?

Partenaires

  • Laboratoire de Mécanique et d’Acoustique (LMA)
  • Acoustics Research Institut, Vienne, Autriche (ARI)

Financement

Financement ANR bi-latéral France Autriche

Axe du laboratoire en lien

Responsable

2013 > 2016