PROCEDIMIENTO Y APARATO DE PROCESAMIENTO DE SEÑALES DE AUDIO.

Un procedimiento para procesar una serie de señales de audio de entrada (60) que representan una serie de fuentes de audio virtuales situadas en posiciones predeterminadas alrededor de un oyente para generar un conjunto reducido de señales de salida de audio para su reproducción en dispositivos de altavoz situados alrededor de un oyente,

comprendiendo el procedimiento las etapas: (a) para cada una de dichas señales de audio de entrada y para cada una de dichas señales de salida de audio: (i) convolucionar dichas señales de audio de entrada (60) con una parte de cabecera inicial (101, 102, 103, 104) de una respuesta de impulso correspondiente que correlaciona sustancialmente el sonido inicial y reflexiones anteriores para una respuesta de impulso de una fuente de audio virtual correspondiente con un dispositivo de altavoz correspondiente para formar una serie de respuestas iniciales; (b) para cada una de dichas señales de audio de entrada (60) y para cada una de dichas señales de salida de audio: (i) formar una mezcla combinada a partir de dichas señales de entrada de audio (60); y (ii) determinar una única cola de convolución; (iii) convolucionar dicha mezcla combinada con dicha única cola de convolución para formar una respuesta de cola combinada; (c) para cada una de dichas señales de salida de audio: (i) combinar una serie correspondiente de respuestas iniciales y una respuesta de cola combinada correspondiente para formar dicha señal de salida de audio, caracterizado porque dicha única cola de convolución se forma combinando las colas de dichas respuestas de impulso correspondientes

Tipo: Patente Internacional (Tratado de Cooperación de Patentes). Resumen de patente/invención. Número de Solicitud: PCT/AU1999/000002.

Solicitante: DOLBY LABORATORIES LICENSING CORP.

Nacionalidad solicitante: Estados Unidos de América.

Dirección: 100 PORTRERO AVENUE SAN FRANCISCO, CA 94103 ESTADOS UNIDOS DE AMERICA.

Inventor/es: MCGRATH,David Stanley, McKEAG,Adam,Richard, DICKENS,Glenn,Norman, CARTWRIGHT,Richard,James, REILLY,Andrew,Peter.

Fecha de Publicación: .

Fecha Solicitud PCT: 6 de Enero de 1999.

Clasificación PCT:

  • H04S3/00 ELECTRICIDAD.H04 TECNICA DE LAS COMUNICACIONES ELECTRICAS.H04S SISTEMAS ESTEREOFONICOS.Sistemas que utilizan más de dos canales, p. ej. sistemas cuadrafónicos (H04S 5/00, H04S 7/00 tienen prioridad).
  • H04S7/00 H04S […] › Disposiciones para la indicación; Disposiciones para el control, p. ej. para el control de la compensación.

Clasificación antigua:

  • G06F17/10 FISICA.G06 CALCULO; CONTEO.G06F PROCESAMIENTO ELECTRICO DE DATOS DIGITALES (sistemas de computadores basados en modelos de cálculo específicos G06N). › G06F 17/00 Equipo o métodos de procesamiento de datos o de cálculo digital, especialmente adaptados para funciones específicas (recuperación de la información, estructuras de las bases de datos o estructuras de los sistemas de archivos G06F 16/00). › Operaciones matemáticas complejas.
  • H03H17/06 H […] › H03 CIRCUITOS ELECTRONICOS BASICOS.H03H REDES DE IMPEDANCIA, p. ej. CIRCUITOS RESONANTES; RESONADORES (medidas, ensayos G01R; disposiciones para producir una reverberación sonora o un eco G10K 15/08; redes de impedancia o resonadores que se componen de impedancias distribuidas, p. ej. del tipo guía de ondas, H01P; control de la amplificación, p. ej. control del ancho de banda de los amplificadores, H03G; sintonización de circuitos resonantes, p. ej. sintonización de circuitos resonantes acoplados, H03J; redes para modificar las características de frecuencia de sistemas de comunicación H04B). › H03H 17/00 Redes que utilizan técnicas digitales. › Filtros no recursivos.
  • H04S5/00 H04S […] › Sistemas seudoestereofónicos, p. ej. en los que las señales de un canal suplementario son derivadas de la señal monofásica por desfase, retardo o reverberación.

Países PCT: Austria, Bélgica, Suiza, Alemania, Dinamarca, España, Francia, Reino Unido, Italia, Liechtensein, Países Bajos, Suecia.

PDF original: ES-2364471_T3.pdf

 


Fragmento de la descripción:

Campo de la invención

La presente invención se refiere al campo del procesamiento de señales de audio y, en particular, desvela procedimientos de convolución eficaces para la convolución de señales de audio de entrada con funciones de respuesta de impulso o similares.

Antecedentes de la invención

La solicitud PCT internacional número PCT/AU93/00330 titulada “Digital Filter Having High Accuracy and Efficiency”, presentada por el presente solicitante, desvela un proceso de convolución que tiene una latencia extremadamente baja además de permitir una larga convolución eficaz de funciones detalladas de respuesta de impulso.

Se conoce la utilización de la convolución de funciones de respuesta de impulso para añadir “color” a señales de audio de manera que cuando, por ejemplo, se reproducen en auriculares, las señales proporcionan una experiencia de escucha “fuera de la cabeza”. Desafortunadamente, el proceso de convolución, aunque utiliza avanzas técnicas algorítmicas tales como la transformada rápida de Fourier (FFT, Fast Fourier Transform), requiere frecuentemente un excesivo tiempo computacional. Los requisitos computacionales aumentan normalmente cuando múltiples canales deben convolucionarse de manera independiente, como es normalmente el caso cuando se requieren capacidades de sonido totalmente envolventes. Normalmente, los procesadores DSP de los módems no pueden proporcionar los recursos para una convolución total de las señales, especialmente cuando hay restricciones de tiempo real en la latencia de la convolución.

La patente estadounidense 5491754 a nombre de Jot et al., describe una espacialización artificial de señales de audio utilizando una cola de reverberación generada artificialmente. En particular, se describe un procedimiento para una espacialización artificial de señales digitales de audio, haciendo posible que actúe sobre señales elementales, réplicas de la señal digital de audio, donde diferentes retardos crean señales elementales retardadas sumadas después de ponderarse con la señal digital de audio con el fin de crear la señal digital de audio espacializada. Una pluralidad de combinaciones lineales de las señales como señales elementales retardadas y combinadas se suma con las señales elementales para simular una reverberación posterior. Las combinaciones lineales se llevan a cabo mediante un bucle unitario y una atenuación. Con cada retardo se lleva a cabo una función monotónica decreciente de un tiempo de reverberación que ha de simularse y que es proporcional al retardo. Se realiza una corrección espectral antes de la suma ponderada. Este procedimiento requiere además una gran capacidad de procesamiento.

El documento EP 0 762 803, titulado “Headphone device”, desvela un dispositivo de auriculares que detecta un ángulo de giro de la cabeza para realizar una localización de imagen de sonido.

El documento US 5 802 180, titulado “Method and Apparatus for efficient presentation of high-quality threedimensional audio including ambient effects”, desvela una espacialización de campos de sonido como respuesta a la ubicación de la fuente de sonido y a la posición del oyente.

El documento WO 95/31881, titulado “Three-dimensional virtual audio display employing reduced complexity imaging filtres”, se refiere a una visualización virtual de audio utilizando funciones alisadas de transferencia relativas a la cabeza.

El documento US 5 438 623, titulado “multi-channel espatialization system for audio signals”, desvela la utilización de funciones sintéticas de transferencia relativas a la cabeza para la espacialización de campos sonoros.

El documento US 5 371 799, titulado “stereo headphone sound source localization system”, se refiere a la espacialización de campos sonoros procesando por separado sonido directo, reflexiones anteriores y reverberación.

Por lo tanto, existe una necesidad general de reducir los requisitos de procesamiento de un sistema de convolución total manteniendo sustancialmente al mismo tiempo la calidad global del proceso de convolución.

Resumen de la invención

Según un primer aspecto de la presente invención, se proporciona un procedimiento para procesar una serie de señales de audio de entrada que representan una serie de fuentes de audio virtuales situadas en posiciones predeterminadas alrededor de un oyente para generar un conjunto reducido de señales de salida de audio para su reproducción en dispositivos de altavoz situados alrededor de un oyente, comprendiendo el procedimiento las etapas de:

(a) para cada una de dichas señales de audio de entrada y para cada una de dichas señales de salida de audio:

(i) convolucionar dichas señales de audio de entrada con una parte de cabecera inicial de una respuesta de impulso correspondiente que correlaciona sustancialmente el sonido inicial y reflexiones anteriores para una respuesta de impulso de una fuente de audio virtual correspondiente con un dispositivo de altavoz correspondiente para formar una serie de respuestas iniciales;

(b) para cada una de dichas señales de audio de entrada y para cada una de dichas señales de salida de audio:

(i) formar una mezcla combinada a partir de dichas señales de entrada de audio; y

(ii) determinar una única cola de convolución;

(iii) convolucionar dicha mezcla combinada con dicha única cola de convolución para formar una respuesta de cola combinada;

(c) para cada una de dichas señales de salida de audio:

(i) combinar una serie correspondiente de respuestas iniciales y una respuesta de cola combinada correspondiente para formar dicha señal de salida de audio, caracterizado porque dicha única cola de convolución se forma combinando las colas de dichas respuestas de impulso correspondientes.

Las señales de audio de entrada se convierten preferentemente al dominio de frecuencia y una convolución se lleva a cabo en el dominio de frecuencia. Las respuestas de impulsos pueden simplificarse en el dominio de frecuencia poniendo a cero los coeficientes de mayor frecuencia y eliminando etapas de multiplicación donde se utilizan preferentemente los coeficientes de mayor frecuencia puestos a cero.

Las convoluciones se llevan a cabo preferentemente utilizando un proceso de convolución de baja latencia. El proceso de convolución de baja latencia puede incluir preferentemente las etapas de: transformar primeras partes de las señales de audio de entrada con un tamaño de bloque predeterminado en bloques de coeficientes de entrada de dominio de frecuencia correspondientes; transformar segundas partes de las señales de respuesta de impulso con un tamaño de bloque predeterminado en bloques de coeficientes de impulso de dominio de frecuencia correspondientes; combinar cada uno de los bloques de coeficientes de entrada de dominio de frecuencia con bloques predeterminados de los bloques de coeficientes de impulso de dominio de frecuencia correspondientes de una manera predeterminada para generar bloques de salida combinados; agrupar bloques predeterminados de los bloques de salida combinados para generar respuestas de salida de dominio de frecuencia para cada una de las señales de salida de audio; transformar las respuestas de salida de dominio de frecuencia en señales de salida de audio de dominio de tiempo correspondientes; proporcionar las señales de salida de audio de dominio de tiempo.

La presente invención puede implementarse de varias formas diferentes, por ejemplo, utilizando una unidad de procesamiento de protección contra saltos ubicada en una unidad de reproducción de CD-ROM, utilizando un circuito integrado dedicado que comprende una forma modificada de un convertidor de digital a analógico, utilizando un procesador de señales digitales dedicado o programable, o utilizando un procesador DSP interconectado entre un convertidor de analógico a digital y un convertidor de digital a analógico. Como alternativa, la invención puede implementarse utilizando un dispositivo externo extraíble aparte conectado entre un generador de señales de salida sonoras y un par de auriculares, proporcionándose las señales de salida sonoras en una forma digital para su procesamiento por el dispositivo externo.

Modificaciones adicionales pueden incluir la utilización de un control variable para alterar las funciones de respuesta de impulso de una manera predeterminada.

Según un segundo aspecto de la presente invención, se proporciona un aparato... [Seguir leyendo]

 


Reivindicaciones:

1. Un procedimiento para procesar una serie de señales de audio de entrada (60) que representan una serie de fuentes de audio virtuales situadas en posiciones predeterminadas alrededor de un oyente para generar un conjunto reducido de señales de salida de audio para su reproducción en dispositivos de altavoz situados alrededor de un oyente, comprendiendo el procedimiento las etapas:

(a) para cada una de dichas señales de audio de entrada y para cada una de dichas señales de salida de audio:

(i) convolucionar dichas señales de audio de entrada (60) con una parte de cabecera inicial (101, 102, 103, 104) de una respuesta de impulso correspondiente que correlaciona sustancialmente el sonido inicial y reflexiones anteriores para una respuesta de impulso de una fuente de audio virtual correspondiente con un dispositivo de altavoz correspondiente para formar una serie de respuestas iniciales;

(b) para cada una de dichas señales de audio de entrada (60) y para cada una de dichas señales de salida de audio:

(i) formar una mezcla combinada a partir de dichas señales de entrada de audio (60); y

(ii) determinar una única cola de convolución;

(iii) convolucionar dicha mezcla combinada con dicha única cola de convolución para formar una respuesta de cola combinada;

(c) para cada una de dichas señales de salida de audio:

(i) combinar una serie correspondiente de respuestas iniciales y una respuesta de cola combinada correspondiente para formar dicha señal de salida de audio,

caracterizado porque dicha única cola de convolución se forma combinando las colas de dichas respuestas de impulso correspondientes.

2. Un procedimiento según la reivindicación 1, que comprende además la etapa de procesar previamente dichas respuestas de impulso:

(a) construyendo un conjunto de funciones de respuesta de impulso correspondientes (140);

(b) dividiendo dichas funciones de respuesta de impulso (140) en una pluralidad de segmentos (141);

(c) para un número predeterminado de dichos segmentos (141), reduciendo los valores de respuesta de impulso en los extremos de dichos segmentos (141).

3. Un procedimiento según cualquier reivindicación anterior, en el que las señales de audio de entrada (60) se convierten al dominio de frecuencia y dicha convolución se lleva a cabo en el dominio de frecuencia.

4. Un procedimiento según la reivindicación 3, en el que las respuestas de impulsos se simplifican en el dominio de frecuencia poniendo a cero los coeficientes de mayor frecuencia y eliminando las etapas de multiplicación donde se utilizan los coeficientes de mayor frecuencia puestos a cero.

5. Un procedimiento según cualquier reivindicación anterior, en el que dichas convoluciones se llevan a cabo utilizando un proceso de convolución de baja latencia.

6. Un procedimiento según la reivindicación 5, en el que el proceso de convolución de baja latencia incluye las etapas de:

transformar primeras partes de las señales de audio de entrada con un tamaño de bloque de solapamiento predeterminado en bloques de coeficientes de entrada de dominio de frecuencia correspondientes; transformar segundas partes de las funciones de respuesta de impulso con un tamaño de bloque predeterminado en bloques de coeficientes de impulso de dominio de frecuencia correspondientes; combinar cada uno de los bloques de coeficientes de entrada de dominio de frecuencia con bloques predeterminados de los bloques de coeficientes de impulso de dominio de frecuencia correspondientes de una manera predeterminada para producir bloques de salida combinados; agrupar bloques predeterminados de los bloques de salida combinados para generar respuestas de salida de dominio de frecuencia para cada dispositivo de altavoz; transformar las respuestas de salida de dominio de frecuencia en señales de salida de audio de dominio de tiempo correspondientes; descartar parte de las señales de salida de audio de dominio de tiempo; proporcionar la parte restante de las señales de salida de audio de dominio de tiempo a los dispositivos de altavoz.

7. Un procedimiento según cualquier reivindicación anterior, en el que el conjunto de señales de audio de entrada

(60) incluye una señal de canal delantero izquierdo, una señal de canal delantero derecho, una señal de canal delantero central, una señal de canal trasero izquierdo y una señal de canal trasero derecho.

8. Un procedimiento según cualquier reivindicación anterior, en el que los dispositivos de altavoz son uno o más conjuntos de auriculares.

9. Un procedimiento según cualquier reivindicación anterior, en el que el procedimiento se lleva a cabo utilizando una unidad de procesamiento de protección contra saltos ubicada en una unidad de reproducción de CD-ROM.

10. Un procedimiento según una de las reivindicaciones 1 a 8, en el que el procedimiento se lleva a cabo utilizando un circuito integrado dedicado que comprende una forma modificada de un convertidor de digital a analógico.

11. Un procedimiento según una de las reivindicaciones 1 a 8, en el que el procedimiento se lleva a cabo utilizando un procesador de señales digitales dedicado o programable.

12. Un procedimiento según una de las reivindicaciones 1 a 8, en el que el procedimiento se lleva a cabo sobre entradas analógicas mediante un procesador DSP interconectado entre un convertidor de analógico a digital y un convertidor de digital a analógico.

13. Un procedimiento según una de las reivindicaciones 1 a 8, en el que los dispositivos de altavoz son un par de auriculares, comprendiendo además el procedimiento la formación de señales de salida sonoras en forma digital para su procesamiento por un dispositivo externo extraíble aparte conectado entre un generador de señales de salida sonoras y el par de auriculares.

14. Un procedimiento según cualquier reivindicación anterior, que comprende además utilizar un control variable para alterar las funciones de respuesta de impulso de una manera predeterminada.

15. Un aparato que incluye un procesador y un dispositivo de almacenamiento configurado con instrucciones que cuando se ejecutan en el procesador hacen que se implemente el procedimiento indicado en cualquiera de las reivindicaciones de procedimiento 1 a 14.

 

Patentes similares o relacionadas:

Método de determinación de una función de transferencia relacionada con la cabeza y una función de diferencia de tiempo interaural personalizadas, y producto de programa informático para realizar el mismo, del 8 de Julio de 2020, de Universiteit Antwerpen: Un método de estimar una función de transferencia relacionada con la cabeza (HRTF) individualizada y una función de diferencia de tiempo interaural (ITDF) […]

Método y sistema para el cálculo de funciones de transmisión de oído externo sintéticas mediante síntesis de campo acústico virtual, del 1 de Julio de 2020, de DEUTSCHE TELEKOM AG: Método para el cálculo de funciones de transmisión de oído externo sintéticas de un oyente, con los siguientes pasos: a) poner a disposición una base de datos de pares […]

Renderización mejorada de contenido de audio inmersivo, del 13 de Mayo de 2020, de DOLBY INTERNATIONAL AB: Método de renderización de audio de entrada para su reproducción en un entorno de reproducción, en donde el audio de entrada incluye por lo menos un […]

Aparato y procedimiento para generar señales de salida basadas en una señal de fuente de audio, un sistema de reproducción de sonido y una señal de altavoz, del 22 de Abril de 2020, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Aparato para generar una primera multitud de señales de salida (102a-d) en función de al menos una señal de fuente de audio (104a, 104b), comprendiendo el aparato: […]

Dispositivo para generar salida de audio, del 15 de Abril de 2020, de QUALCOMM INCORPORATED: Un dispositivo de auriculares que comprende: un primer auricular configurado para: recibir un sonido de referencia en un […]

Sistema para trasmitir adaptativamente objetos de audio, del 8 de Abril de 2020, de DTS LLC: Un sistema para adaptar la trasmisión de un flujo de audio orientado a objetos, el sistema comprendiendo: un monitor de recursos de red configurado para recibir una solicitud […]

SISTEMA Y MÉTODO DE SONIDO ESPECTRAL POSICIONAL, del 30 de Marzo de 2020, de REBOLLO GOMEZ, Joaquin: Se describen un sistema y un método de sonido espectral posicional, capacitados para generar en un entorno una multiplicidad de señales variables en función de la posición y […]

Aparato y método para la renderización de audio empleando una definición de distancia geométrica, del 25 de Diciembre de 2019, de FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWANDTEN FORSCHUNG E.V.: Aparato para reproducir un objeto de audio asociado con una posición, que comprende: un calculador de distancia para calcular distancias de la […]

Utilizamos cookies para mejorar nuestros servicios y mostrarle publicidad relevante. Si continua navegando, consideramos que acepta su uso. Puede obtener más información aquí. .