Saltar al contenido
Pegar imágenes en el foro, mediante equipos móviles ×

Ring Ring ra....


MarkVII

Recommended Posts

A proposito de filtros...

Mi DAC tiene 7 o algo así  (ES9038PRO). En principio intentaba encontrar diferencias, pero con el tiempo me aburrí.

Ustedes pueden escuchar la diferencia entre Apodizing y Fast Minimum Phase por ej.?

 

We all complete. Maybe none of us really understand what we've lived through, or feel we've had enough time.

 

Enlace al comentario
Compartir en otros sitios

1 hour ago, pbanados dijo:

Pero por favor, en qué idioma te lo explico? Leíste mi post anterior?

A ver si con esta explicación se entiende este asunto un poco mejor:

Un filtro apodizante por si solo no va a a cambiar el ringing total (es más, incluso lo podría aumentar); lo que hará es eliminar el pre-ringing, y reemplazarlo por post-ringing. Más aún si opera en el limitado espacio provisto por redbook para estos filtros. Si se quiere que este filtro además logre un post-ringing reducido, debe extender el espacio de acción a un área espectral más grande. Eso se logra de dos maneras (el MQA usa ambas, las a y b explicadas abajo). MQA también lo mejora por una tercera que me arriesgaré a explicar someramente:

a) con un sampling mayor. Al menos 88K, y hasta 352.8K. Eventualmente algún formato hires también podría hacer esto(a riesgo de perder compatibilidad), pero en términos de octavas sigue siendo relativamente poco: pasamos de las 1/7 del redbook a 1 o 2 octavas para que el filtro actúe.

b) iniciando el filtro antes (probablemente mucho antes, como se infiere del "triángulo de captura" de sus documentos). Pues como ya hemos visto, haciéndolo no afectará los armónicos superiores del contenido musical (si lo haría para otro tipo de usos como fotos, pero MQA no está diseñado para esos otros usos). Con esto el filtro gana, además de las anteriores, al menos 4 y probablemente más octavas.

c) Esto es casi peligroso argumentarlo dados los desencuentros que hemos tenido para temas mucho más simples: Al modelar el piso de ruido, el slope extendido del filtro apodizante (los filtros apodizantes construyen una geometría no lineal, sino una especie de "S" según los parámetros con que se programe) se toca antes con el piso de ruido modelado, en zonas supra aurales muy extendidas, alrededor de los 60 Khz (o sea, el vértice derecho del triángulo de captura, eso si el sampling del master original permite llegar tan arriba).

Una vez "hundido" el filtro en ese piso de ruido, no tiene sentido seguir cortando señal que ya sabemos que será solo ruido(de hecho ese ruido es "construido" por MQA, distinto del que había en la captura original), por lo cual la curva de menor pendiente del apodizante no corta completamente esa pseudo-señal (en algún punto esa "S" termina paralela a la base).

Por eso es alguna discusión respecto del "aliasing" que el MQA produciría, lo cual es cierto, pero ese aliasing empieza bastante más arriba de los 60 Khz y queda completamente enmascarado por el piso de ruido, y por ello es por completo irrrelevante (no es audible por frecuencia y por amplitud, y no hay forma de diferenciarlo del ruido mismo en el cual se hunde). Debido a esto último, el MQA no necesita cortar como sí consideraría un brickwall "Shannon", o digamos ortodoxo que sigue a la pata el teorema (*), la totalidad de la amplitud allá tan adentro, sino varios db menos. Esto permite nuevamente que el filtro sea más extendido donde importa, comparado que si no tuviera esta característica.

Además de lo anterior, los filtros que usa MQA no son "estáticos" como sería en cualquier PCM (aún si fueran apodizantes; el DAC que lo implementa tiene un solo filtro, no uno que se va adaptando continuamente), sino condicionados por el contenido musical que está leyendo. Como paralelo a ese contenido significante (la música) el formato contiene un canal de datos (escondido bajo el piso de ruido), los parámetros de ese filtro, que definen su curvatura, al menos teóricamente (y esto se infiere de lo que ellos han dicho en entrevistas) se va modificando continuamente dependiendo de lo que el contenido demande. Adicionalmente, y esto es lo más potente del asunto, esto sucede tanto en etapa ADC (con el filtro actuando como anti-aliasing), como en DAC (con el filtro actuando como reconstrucción). El canal de datos con la información almacenada en él vincula ambos para que tengan la mejor performance posible.

Cuando tenga un tiempo trataré de poner un gráfico explicativo del punto c de arriba.

(*): A esto creo que se refieren cuando dicen que el formato ocupa teorías modernas de sampling (entiendo que cosas similares se hacen en otros usos, como en imágenes médicas), y no en lo inicialmente definido por Shannon.

Editado por pbanados

1: Audioquest Niagara 3000 >CD Sony XA50ES / Rega Planar 3, AT-OC9XML, Moon 110LP / Macmini (Tidal+Roon) > Theoretica BACCH4Mac >RME Babyface pro/ Mytek Brooklyn DAC > Rogue Audio Cronus Magnum III (KT120) >Magnepan 1.7i  

2: TV qled 55"/ Roon> Advance Acoustics MyConnect 50 > Kef LS50 Meta.  

"I've looked at life from both sides nowFrom win and lose and still somehowIt's life's illusions I recallI really don't know life at all" Joni Mitchell

Enlace al comentario
Compartir en otros sitios

hace 4 horas, guax dijo:

A proposito de filtros...

Mi DAC tiene 7 o algo así  (ES9038PRO). En principio intentaba encontrar diferencias, pero con el tiempo me aburrí.

Ustedes pueden escuchar la diferencia entre Apodizing y Fast Minimum Phase por ej.?

 

Interesante la pregunta @guax. Efectivamente, también me pasaba que no notaba muchas diferencias en esos filtros en DACs corrientes. En el caso del apodizing, creo que en parte es porque los beneficios de quitar el pre-ringing quedan parcialmente enmascarados por el post-ringing más extendido que generan (ver post anterior). Especialmente si estamos evaluando comparando un formato CD, que no otorga espacio suficiente para que estos mejores filtros se noten (puede que en formatos hires se note algo más). En esto realmente recomiendo leer el muy interesante paper de Ayre de arriba... que dice casi exactamente lo mismo que he venido repitiendo acá, y que más o menos "resumo" con extractos del mismo abajo (en rojo las coincidencias con lo que hemos planteado acá... puntos según el orden del paper de Ayre comentado):

 

1.

Lo que dice sobre las implementaciones "estándar" en DACs, que solo usan el brickwall como fue propuesto originalmente por Shannon.

"In the beginning, there was the common linear-phase, “brickwall” digital filter. This type of digital filter is used in 99+% of all modern digital equipment, for both recording and playback, including the “Measure” position of the original Ayre disc players.

On paper, it looks nearly perfect. There is no phase shift, so it is called a “Linear Phase” filter. However, a filter can only achieve a “Linear Phase” response by introducing pre-ringing. This means that before every single musical transient, there is a “pre-echo”. In nature, there is no such thing as a “pre-echo”. All events must be “causal” in the real world—the cause must precede the effect.

A sharp, “brickwall” filter like this typically introduces about 20 cycles of pre-ringing and 20 cycles of post-ringing. It is very unnatural sounding, as the effect (pre-echo) precedes the cause (musical transient). This time-smear is interpreted by the ear-brain as both a lack of image precision in the soundstage, and also a subtle smearing of the musical sounds together."

Nótese acá la mención a 40 ciclos (21 con el pulso mismo) de ringing. En un CD, cada pulso mide 1.000.000/44.100 =22.67 uS. 41 ciclos serían entonces unos 933 uS, más o menos coincidente con los que los análisis de los paper de MQA establecen para los CD (ellos dicen que serían entre 500 a 5000 uS, dependiendo de la calidad de implementación y hasta donde la magnitud de los overshoots y undershoots se consideren nocivos). 

 

2.

El siguiente paso de mejora implementado históricamente en los DAC para mejorar este problema de transientes fue ocupar filtros de "slow Roll-of". Lo qu dice Ayre:

"By reducing the “sharpness” of the “knee” in the filter’s frequency response, the filter’s transient response is vastly improved. Now there is only about one cycle of pre- and post-ringing. The penalty (remember, there is no such thing as a free lunch—only intelligent tradeoffs) is that there is more “leakage” (aliasing) of high frequencies above 22,050 Hz back in to the audio band. Still, this only affects very high frequencies and the levels are low enough not to cause audible problems."

 

2A.

Luego del paper discurre en un comentario anexo, relacionado con esta teórica posibilidad de no usar filtro en absoluto, como insinuaba @MarkVII:

"A natural extension to this idea is to eliminate the digital filter altogether. In theory this provides the best transient response possible from a digital playback system. There are certain audible advantages to this approach, but they are highly system-dependent and come at the expense of two separate problems.

The first is a loss of high frequencies starting at -0.75 dB at 20 kHz and reaching -3.2 dB at 20 kHz. The second is that the aliased “image” frequencies are injected into the audio signal, creating non-harmonically related distortion that increases in level as the frequency increases, reaching over 50% at 20 kHz unless additional analog filtering is employed.".

Como vimos después por los comentarios dle ingeniero de Sphynx, esta alternativa solo se usa en formatos no comerciales (o sea, de estudio, los DXD) cuya extraodinaria extensión (no factible de usar en formatos comerciales) permite aceptar los problemas mencionados arriba sin que causen artefactos audibles.

 

3.

Un nuevo avance en fue el famoso paper de 2004 de Peter Craven (ya saben, uno de los cerebros del MQA), proponiendo filtros apodizantes. (en este paper de Ayre confirman que esto fue inventado y hasta el nombre apodizing" fue propuesto por Craven, yo tenía dudas):

"In Peter Craven’s 2004 AES paper, he proposed that the playback DAC should include a digital filter that had a corner frequency below the half-sample rate of 22,050 Hz. This would filter out any ringing (pre- and post-) that was intro- duced during the recording process and thereafter embedded on the disc itself. He named this an “apodizing” filter.

It is a mathematical law of any filter, digital or analog, that the steeper the frequency cutoff, the more ringing it will have. In an attempt to avoid the problems of this ringing, Craven proposed using a “Minimum Phase” filter instead of the conventional “Linear Phase” filter. While this means that the phase response now varies, especially at high frequencies, there is no longer any pre-ringing. Furthermore all pre-ringing from the recording process has been filtered out, and the new playback filter only has post-ringing....  Now a giant step forward has been taken in the musical naturalness of digital audio reproduction. The unnatural pre-echoes have been completely eliminated. All of the filter’s ringing occurs after the musical transient. This is just the way that sounds occur in nature. Every sound made in the real world will have post-echoes after the original sound, so the ear-brain system more easily accepts these post-echoes from the digital filter as natural.... 

Note that the post-ringing of a “Minimum Phase” filter is greater than that of a “Linear Phase” filter with the same frequency response. The energy that had been contained in the pre-ringing of the “Linear Phase” filter has simply been delayed until after the transient. (Remember—there are no free lunches.) But redistributing this same total energy leads to significant gains in musical realism.

This type of digital filter is not available in off-the-shelf chips. Instead, it must be implemented in custom DSP filters. In the case of the new Ayre MP (Minimum Phase) disc players, we use sophisticated FPGAs (Field Programmable Gate Arrays) to create the desired custom filter, and the chip is easily reprogrammable should future improvements be made."

Como mencionaba muchos post atrás, estos filtros, de tipo FIR, requieren una lógica matrical de cálculo muy demandante de capacidad de cómputo. Por eso la implementación full de MQA (que usa una derivación de estos filtros como vimos en el post anterior) lo debe hacer por hardware y no por software.

 

4.

Finalmente Ayre propone los que ellos describen como "the best of both worlds":

We therefore sought to combine the best aspects of Craven’s minimum-phase digital filter proposal with a slower roll-off that reduced the overall amount of ringing....

The resulting filter has no pre-echoes, and only about one cycle of post-ringing. This filter is implemented in the “Listen” position of the new Ayre MP disc players. The result is simply the most musically natural digital playback available today"

---

Bueno, ya casi te conté el paper entero, pero es muy interesante ver los gráficos con las implicancias de estos cuatro puntos.  Nótese que todo esto lo está diciendo un empresa que no tiene relación alguna con MQA, pero las coincidencias en el análisis del problema son totales. Y ellos lo terminan implementando en DAC's que valen desde US$5000 a US$8000 (quizás hay más caros aún). En MQA hay DACs extraordinariamente buenos por menos de US$500.

Sobre este último punto 4 de Ayre, es notable como las consideraciones son muy similares  a las que hace MQA y que mencionaba en el post anterior: no basta el apodizante por si solo; para reducir también su post-ringing debe implementarse un "slower Roll-off" en el filtro. En MQA se puede hacer esto con mucho mayor énfasis que en lo que describe Ayre, pues obtiene un espacio mucho mayor para "extender" la pendiente de ese filtro, como  mencionaba en el post anterior (Ayre no puede hacerlo, pues trabaja com PCM estándar, no formatos modificados). Pero fundamentalmente porque también lo hace (especialmente en masters análogos) tanto en etapa de ADC como DAC, (Ayre solo lo puede hacer obviamente en esta última), no trabaja con filtros "estáticos" (llamémoslo como la ropa: "one size fits all" ) sino adaptables a la música procesada;  y vincula ambos procesos (ADC y DAC) mediante las codificaciones contenidas en el archivo.

En este tema específico de la respuesta a impulsos probablemente Ayre logra lo mejor que es posible con archivos PCM estándar. MQA al menos en teoría logra (en este punto al menos) algo significativamente superior (el ringing *total* de los mejores archivos MQA es de 3uS a 10 uS, mucho menos que un solo ciclo de sampling de un CD)  pues eso es solo posible con el cambio de paradigma que las teorías modernas de sampling permiten, a las que no adscriben los PCM "agnósticos" del contenido.

 

Editado por pbanados
  • Confused 1

1: Audioquest Niagara 3000 >CD Sony XA50ES / Rega Planar 3, AT-OC9XML, Moon 110LP / Macmini (Tidal+Roon) > Theoretica BACCH4Mac >RME Babyface pro/ Mytek Brooklyn DAC > Rogue Audio Cronus Magnum III (KT120) >Magnepan 1.7i  

2: TV qled 55"/ Roon> Advance Acoustics MyConnect 50 > Kef LS50 Meta.  

"I've looked at life from both sides nowFrom win and lose and still somehowIt's life's illusions I recallI really don't know life at all" Joni Mitchell

Enlace al comentario
Compartir en otros sitios

Hay otro tema interesante que uno podría haber discutido o aprendido de algún experto en FFT que tuviera el mate abierto a nuevas ideas y no un bloqueo de sus prejuicios... no pierdo la esperanza que aparezca alguno por acá. Advierto que este tema lo entiendo solo parcialmente, pueden haber errores en algunas cosas que pongo a continuación:

Lo que MQA hace en el DAC es reemplazar los filtros de reconstrucción (que Shannon proponía como función sin(x)/x [llamada función sinc(x); y que son en la práctica la contraparte al "brickwall" anti-aliasing de un ADC, pero acá en etapa DAC], y que los DAC actuales implementan con funciones similares que no tienen el problema de infinitud teórico de señal de esa función), por otros filtros que no generan los "ringing" de esa función sinc(x) (o las alternativas actualmente usadas). Para lo que sigue hay que identificar los dos componentes de ese ringing: un overshoot (onda superior del ringing) y el undershoot (parte inferior del ringing) (sorry por el tamaño del gráfico):

700px-Si-sinc.png

El mismo fenómeno del gráfico anterior amplificado en magnitud se vé así en un pulso grande, y así en un archivo MQA (que sea de sampling alto y buena señal de entrada; nótese que casi triplicaron la escala vertical - la amplitud- del pulso para que represente la transiente de un impulso y se vea mejor lo que hace; y que la escala horizontal está en milisegundos y no en samplings como el anterior):

918-Zenfig03.jpg  918-Zenfig16.jpg

 

El problema de esto es que son justamente esos ringing de la función sinc(x) aquellos en que Shannon confiaba para la reconstrucción perfecta de la onda, pues el efecto combinado de esos over y undershoots de varios sampling contiguos son los que construyen la "redondez" de la señal reconstruida entre samplings (lo mismo hacen actualmente las funciones alternativas). Como en este gráfico:

Sinc-Interp.png

 

Como MQA al eliminar este ringing transforma cada sampling en algo parecido a una señal "Dirac" (un impulso casi instantáneo, como en el gráfico derecho de arriba- pero un real "Dirac" tiene 0 ringing), ya no cuenta con esas onditas intermedias que permitirían esa reconstrucción perfecta. Acá entonces hay otro aspecto del formato (que solo puede inferirse por lo que se lee en sus artículos y papers, pues no está explícitamente explicado), es que el MQA (al igual como hacen otros DAC que hacen cosas parecidas, y como supongo debe hacer el Ayre de los post anteriores) debe hacer interpolación entre samplings (*). MQA hace esto con un tipo específico que se llama "interpolación por b-spline", que permite esta reconstrucción perfecta de la onda original, sin introducir el "time-smearing" de lo sinc(x). 

Me encantaría poder explicar como funciona esta interpolación y tengo un par de papers explicándola, pero son extremadamente complejos, confieso que no paso de la primera página.

Si ha alguien le interesa, este paper es "algo" más accesible:

"Theory and Practice of Image B-Spline Interpolation" - Thibaud Briand, Pascal Monasse. Está disponible para bajarlo sin costo.

---

Otro asunto técnico bien relevante pero aún más complejo son los que explican las teorías modernas de sampling. MQA dice se basan en una llamada "sampling by finite range of innovation". Estos dos papers son completamente in-entendibles para mí, pero también puede ser interesante para los tuercas (tb se pueden bajar sin costo). Creo que al menos dos de estos documentos están citados en algunos papers de MQA.

"Sampling Signals With Finite Rate of Innovation" -  Martin Vetterli, Fellow, IEEE, Pina Marziliano, and Thierry Blu, Member, IEEE

"Sparse sampling: theory, methods and an application in neuroscience" -Jon Oñativia · Pier Luigi Dragotti

 

(*): hay  muchos que creen que los formatos hires (un 24/192 por ej) lo que hacen es "densificar" los sampling para el mismo espectro total (en un CD, por ejemplo, limitado hasta 22.05 Khz), generando un efecto similar a esta interpolación. Y que por eso suenan más "análogos", porque reconstruirían señales más "redondas", sin "escaleras" como el CD. Esto no es así, el CD no construye "escaleras" (por lo explicado arriba); y los archivos hires, en correspondencia al teorema de Nyquist-Shannon no densifican los sampling, sino los extienden a zonas supra-aurales: en el 24/192 del ejemplo, hasta 96 Khz.

Lamentablemente hay muchos fabricantes de DAC (Benchmark por ej) o servicios (Qobuz por ej) que venden esa pomada de que hires significan samplings más densos, que es un abierto engaño a los usuarios, me parece.

 

Editado por pbanados

1: Audioquest Niagara 3000 >CD Sony XA50ES / Rega Planar 3, AT-OC9XML, Moon 110LP / Macmini (Tidal+Roon) > Theoretica BACCH4Mac >RME Babyface pro/ Mytek Brooklyn DAC > Rogue Audio Cronus Magnum III (KT120) >Magnepan 1.7i  

2: TV qled 55"/ Roon> Advance Acoustics MyConnect 50 > Kef LS50 Meta.  

"I've looked at life from both sides nowFrom win and lose and still somehowIt's life's illusions I recallI really don't know life at all" Joni Mitchell

Enlace al comentario
Compartir en otros sitios

On 24-08-2022 at 13:27, guax dijo:

A proposito de filtros...

Mi DAC tiene 7 o algo así  (ES9038PRO). En principio intentaba encontrar diferencias, pero con el tiempo me aburrí.

Ustedes pueden escuchar la diferencia entre Apodizing y Fast Minimum Phase por ej.?

 

Depende de la resolución que le estás pasando al Sabre32. Según estuve leyendo a propósito de mi próximo Upgrade. Los filtros operan con resoluciones estándares 44.1 y 48 Khz y tienen que ver con el Oversampling propio interno del 9038 pro. Si al Dac le pasas una resolución mayor entonces manda el filtro de la fuente y no el del DAC.

Yo en este momento le paso todo con upsampling a 384 KHz a mi DAC desde mi streamer Volumio Primo (Qobuz) y se nota claramente una mejora en el sonido. Si pruebo los distintos filtros que trae no hay ningún cambio en el sonido.

 

Enlace al comentario
Compartir en otros sitios

Pero el filtro no es parte del proceso de conversión AC? Como podría mandar el de la fuente?

En todo caso, mi pregunta era muy sencilla. Pueden discriminar consistentemente entre un filtro cargado al pre y otro cargado al post?  Es que la discusión me suena parecida a la del jitter 😊

Creo que en su estilo particular me dieron dos no-respuestas 🙂

 

Editado por guax

We all complete. Maybe none of us really understand what we've lived through, or feel we've had enough time.

 

Enlace al comentario
Compartir en otros sitios

hace 58 minutos, Bozon dijo:

Depende de la resolución que le estás pasando al Sabre32. Según estuve leyendo a propósito de mi próximo Upgrade. Los filtros operan con resoluciones estándares 44.1 y 48 Khz y tienen que ver con el Oversampling propio interno del 9038 pro. Si al Dac le pasas una resolución mayor entonces manda el filtro de la fuente y no el del DAC.

Yo en este momento le paso todo con upsampling a 384 KHz a mi DAC desde mi streamer Volumio Primo (Qobuz) y se nota claramente una mejora en el sonido. Si pruebo los distintos filtros que trae no hay ningún cambio en el sonido.

 

Si, tampoco te caché muy bien @Bozon. Dices que los filtros del DAC solo funcionan con 44.1 o 48K de sampling? Si es así, es poco lo que debes poder apreciar. Para que el filtro (al menos el apodizing) tenga verdaderamente efectos notorios, tendría que extenderse en espectro (hacerse menos vertical), para reducir el post-ringing que genera. Eso no pasa un formato hires (que solo hacen un brickwall desplazado a su nueva Nyquist), pero sí podría pasar en un upsampling creado por Roon o el propio DAC (que además de aumentar los samplings, le podrían decir al DAC que modifique la pendiente del filtro).

Si le mandas mayor resolución y no actúan los filtros especiales, entonces el DAC debiera simplemente usar el filtro de reconstrucción estándar desplazado a la fr de Nyquist del nuevo sampling (la mitad del sampling enviado: en un 96K ->48K). O sea, un filtro de reconstrucción de efectos idénticos a los de un brickwall: la función sinc(x) o su equivalente actual implementado en tu DAC, según lo comentado en los post anteriores.

@guax: mi "no respuesta" fue que no, que cuando hice esas pruebas (hace mucho), las diferencias eran realmente muy pocas. Pero creo que porque las hice solo con CD's (el problema allí es que el filtro sigue operando en el minúsculo espacio entre 20Khz y 22.05 Khz). Si las hubiera hecho con archivos de mayor sampling habría mejores chances que se percibieran, creo.

1: Audioquest Niagara 3000 >CD Sony XA50ES / Rega Planar 3, AT-OC9XML, Moon 110LP / Macmini (Tidal+Roon) > Theoretica BACCH4Mac >RME Babyface pro/ Mytek Brooklyn DAC > Rogue Audio Cronus Magnum III (KT120) >Magnepan 1.7i  

2: TV qled 55"/ Roon> Advance Acoustics MyConnect 50 > Kef LS50 Meta.  

"I've looked at life from both sides nowFrom win and lose and still somehowIt's life's illusions I recallI really don't know life at all" Joni Mitchell

Enlace al comentario
Compartir en otros sitios

@pbanados y @guax

Quedé también con la duda, pero según leí, el DAC queda en filtro fijo con altas resoluciones de sampling y lo que sucede como filtro es el efecto que produce el software digital de upsampling. Por ejemplo, HQPlayer o un HW como el Chord MScaler que hace lo mismo.

En ASR pusieron como se ve el filtro aplicado por MScaler conectado al DAC: al aumentar la potencia de procesamiento se logra llegar casi a un brickwall perfecto:

chord-m-scalar-upsampler-filter-response

El DAC no tiene la capacidad de procesar esa cantidad de upsampling y por eso los filtros del mismo caen como una curva de ola.

Los filtros son en dominio digital y se programan en el firmware del equipo. De hecho algunos DACs traen unos propios y el de MQA también es custom. 

Eso genera confusión porque ESS provee un paquete de filtros estándar para usar pero no son internos del chip propiamente tal si no que del firmware que lo controla.

Tengo un DAC que compré que viene en camino (Gustard X26 Pro) que trae su propio DSP de filtros (3 + MQA) implementado en un procesador propio Analog Devices y con éste alimenta a 2x9038 Pro 

Editado por Bozon
Enlace al comentario
Compartir en otros sitios

pbanados no notó diferencias relevantes porque usó solo CD. Bozon no nota diferencias porque tiene un upsampler por software antes del DAC. Yo no noté diferencias ni con CD ni con algunos archivos a 96khz.

Agregaré los filtros a mi lista de preocupaciones audiófilas ignoradas 🙂

 

Editado por guax
  • Haha 1

We all complete. Maybe none of us really understand what we've lived through, or feel we've had enough time.

 

Enlace al comentario
Compartir en otros sitios

hace 5 minutos, guax dijo:

pbanados no notó diferencias relevantes porque usó solo CD. Bozon no nota diferencias porque tiene un umsampler por sofware antes del DAC. Yo no noté diferencias ni con CD ni con algunos archivos a 96khz.

Agregaré los filtros a mi lista de preocupaciones audiófilas ignoradas 🙂

 

Le acabas de sentenciar a @pbanados que MQA es un mito inaudible (MQA es un filtro). 🤣

Hablando en serio, los filtros si son audibles. Yo usaba uno con "ultra fast roll off" con mis parlantes anteriores porque eran muy brillantes y ayudaba bastante a domar esos agudos).

 

 

 

Editado por Bozon
Enlace al comentario
Compartir en otros sitios

hace 13 horas, Bozon dijo:

Le acabas de sentenciar a @pbanados que MQA es un mito inaudible (MQA es un filtro). 🤣

Hablando en serio, los filtros si son audibles. Yo usaba uno con "ultra fast roll off" con mis parlantes anteriores porque eran muy brillantes y ayudaba bastante a domar esos agudos).

jaja.... buena @Bozon. Yo también creo que son audibles, pero los filtros que tratan de hacerlo en un CD solo cambiando un filtro por otro deben generar cambios demasiado sutiles no más. No por el filtro mismo, sino por el poco espacio donde actúan, según lo define el redbook.

Igual, que un fabricante como Ayre (cuyo dueño lo fue tb de los parlantes Avalon Acoustics, que en su época eran verdaderos objetos de adoración) califique la eliminación del pre-ringing que se logra con los apodizing como "a giant step forward ... in the musical naturalness of digital audio reproduction" es bastante decidor me parece. Alguna importancia tendrán...

Y si @guax , me parece sano no preocuparse demasiado de ellos. Mi asunto con los filtros es más por entender qué es lo que hace exactamente el MQA. Por lo que he logrado captar, allí sí que la aplicación de filtros hace un cambio relevante, dado que intentan lo posible por hacer lo inverso que el redbook: ampliar todo cuanto se pueda el espacio ("bandwidth") donde esos filtros actúan. Que a uno le guste o no el resultado es otro cuento.

---

También hay algo que tener en cuenta en esto de las curvas de los filtros: tengo la impresión que algunos los ven como un "factor reductor" de la frecuencia: si el filtro muestra una caída de, por ej, 10 db en 20 Khz, asumen que la respuesta de frecuencia cae en esa proporción; lo que yo creo que realmente hace ese filtro es "cortar" frecuencias 10 db antes del máximo headroom posible por el formato en esa frecuencia. Si el contenido nunca llegó a esa amplitud dinámica en esa frecuencia específica, no afecta en nada ese recorte (en frecuencias, pero sí hace cambios en dominio del tiempo o de las fases). Esa es una de la tesis de MQA: que *reproduciendo música* no tiene sentido respetar ese total headroom en esas octavas más altas, que estarán siempre sin llenar, si con ello nos estamos "comprando" otro problema: el ringing del filtro muy vertical. Por lo demás, gran parte de los DAC hacen en menor medida lo mismo: empiezan el "hombro" del filtro brickwall antes de 20 Khz, para minimizar el aliasing que sí generarán (el punto 2 del paper de Ayre), pues aún empezando más atrás no logran cortar a 0 la señal entes de la fr de Nyquist.

Esto tb parece que fuera un chamullo mío, no verificable en la práctica, si un lee este hilo. Pero el propio Amir cuando comparó el MQA, DSD y otros PCM mostró la impajaritable caída de amplitud en las frecuencias mayores en cualquier contenido musical, como en esta espectrografía de un 24/96. Lo que está registrado acá es un instante (en el video Amir mostró un largo tiempo lo que estaba pasando, esta es una captura de pantalla de un momento), pero si retuvieras los peak como hacen otros gráficos espectrales, la diferencia es muy poca; nótese la escala lineal y no logarítmica de las frecuencias. También tener en cuenta que esto incluye el ruido y no solo la señal musical. Si uds mismos miden lo mismo en sus casas con alguna app, verán exactamente el mismo patrón, no importa qué música pongan:

Amir-spectral-24-96.png

 

En los famosos tests de Golden Sound el tipo se escandalizó porque recortaban en exceso las ondas cuadradas que le envió en sus tests. Pero si entiendes lo que el algoritmo hace, sabes de antemano que responderá mal a esa señal (y específicamente el algoritmo automatizado en línea) por lo cual de la partida es una prueba o mal concebida (como decía en algún lado, equivalente a medir la amortiguación de un F1 en un camino off-road) o mal intencionada, como lo demostró la respuesta de MQA (gráfico sacado del anexo 2 de esa respuesta, que nadie leyó):

Music-Corpus-Test-Signal.png

En burdeos lo que el proceso *en linea* espera recibir (dándose un margen de seguridad); en verde lo que el test envió en el archivo de 44K, y rojo lo del archivo 88K. Los saltitos son cada armónico de esas señales. En azul, dos enormes tonos adicionales enviados en el test.

Es imposible no pensar que esto lo prepararon a  propósito para que anduviera mal. Y ojo, enfatizo que esto sucede en el test *en linea*. La misma respuesta establece que en los procesos de estudio el software pre-analiza la señal, y si encuentra anomalías de este estilo adapta el funcionamiento de los filtros para que esas señales no se recorten. Como demostraron (anexo 4) con esta reproducción de la onda del test, pero hecha por el proceso de estudio y no en línea:

882-Square.png

Para contrastar, habría que ver este mismo gráfico según fue publicado en el test de Golden Sound, con resultados desastrosos (*). Esta reconstrucción virtualmente perfecta de la onda cuadrada enviada en el test dudo que la logre cualquier otro PCM (quizás sí un DXD), que tarde o temprano llegarán a limitaciones de amplitud en zonas supra-aurales.

(*) adicionalmente, el tipo no le hizo "dithering" a la señal. Si has leído algo de MQA sabes hasta qué punto el algoritmo depende de que exista ese dithering. Si no lo haces, estás buscando que le proceso falle. Ningún archivo comercial deja de tenerlo, es un paso fundamental para publicar algo que pase cualquier estándar de mínima calidad al usuario final.

Editado por pbanados

1: Audioquest Niagara 3000 >CD Sony XA50ES / Rega Planar 3, AT-OC9XML, Moon 110LP / Macmini (Tidal+Roon) > Theoretica BACCH4Mac >RME Babyface pro/ Mytek Brooklyn DAC > Rogue Audio Cronus Magnum III (KT120) >Magnepan 1.7i  

2: TV qled 55"/ Roon> Advance Acoustics MyConnect 50 > Kef LS50 Meta.  

"I've looked at life from both sides nowFrom win and lose and still somehowIt's life's illusions I recallI really don't know life at all" Joni Mitchell

Enlace al comentario
Compartir en otros sitios

@pbanados

hace 3 horas, pbanados dijo:

También hay algo que tener en cuenta en esto de las curvas de los filtros: tengo la impresión que algunos los ven como un "factor reductor" de la frecuencia: si el filtro muestra una caída de, por ej, 10 db en 20 Khz, asumen que la respuesta de frecuencia cae en esa proporción

En realidad si hay roll offs. Se nota mucho por ejemplo en los Chord. El Qutest por ejemplo:

https://chordelectronics.co.uk/wp-content/uploads/2018/01/Qutest-User-manual-2.0-1.pdf

Tiene un flitro "Warm" y otro "Warm HF roll-off" yo lo tuve y los probé y hacen justamente lo que dicen.

Enlace al comentario
Compartir en otros sitios

hace 8 horas, Bozon dijo:

@pbanados

En realidad si hay roll offs. Se nota mucho por ejemplo en los Chord. El Qutest por ejemplo:

https://chordelectronics.co.uk/wp-content/uploads/2018/01/Qutest-User-manual-2.0-1.pdf

Tiene un flitro "Warm" y otro "Warm HF roll-off" yo lo tuve y los probé y hacen justamente lo que dicen.

Claro, pero como dicen en el manual, no lo hacen con una curva de EQ, sino con ajustes en sus FPGA. Puede ser una particularidad de Chord, en que estos seteos funcionan como una suerte de control de tonos. Yo más bien me refería a los filtros propios del DAC (los de reconstrucción específicamente), no configurables por los usuarios.

En todo caso, al menos en el apodizante /spline de reconstrucción del MQA entiendo que funciona así: cortando y no reduciendo la señal.

1: Audioquest Niagara 3000 >CD Sony XA50ES / Rega Planar 3, AT-OC9XML, Moon 110LP / Macmini (Tidal+Roon) > Theoretica BACCH4Mac >RME Babyface pro/ Mytek Brooklyn DAC > Rogue Audio Cronus Magnum III (KT120) >Magnepan 1.7i  

2: TV qled 55"/ Roon> Advance Acoustics MyConnect 50 > Kef LS50 Meta.  

"I've looked at life from both sides nowFrom win and lose and still somehowIt's life's illusions I recallI really don't know life at all" Joni Mitchell

Enlace al comentario
Compartir en otros sitios

Como sabemos, en el foro tenemos un experto en FFT que se estima suficientemente conocedor del tema como para cuestionar a los autores de varios de los de papers de relevancia mundial en procesamiento de señales de audio (Gerzon, Craven, Stuart). Pensé que podría ser autor de alguno de ellos y me puse a buscar qué chilenos han escrito papers importantes en el tema; pero encontré solo un (por lo demás co-autor de uno de los papers en links en un post anterior): Milan Derpich, profe de U Santa María, doctor en matemáticas, laureado por la U the NewCastle (Australia, mejor tesis de doctorado), que trabajó en investigación en varios temas muy sofisticados de procesamiento de señales mencionados al pasar acá, y al parecer muy aficionado a la música.

Habría sido encachado haberlo invitado a que complementara nuestros balbuceos acá. Lamentablemente falleció hace tres meses atrás. 

https://usm.cl/noticias/homenaje-a-milan-derpich-musa-q-e-p-d/

https://noticias.usm.cl/2010/06/10/universidad-de-newcastle-distingue-a-investigador-del-departamento-de-electronica/

Que lamentable. Al parecer el tipo era extraordinariamente capo, y muy simpático por lo que cuentan.

 

1: Audioquest Niagara 3000 >CD Sony XA50ES / Rega Planar 3, AT-OC9XML, Moon 110LP / Macmini (Tidal+Roon) > Theoretica BACCH4Mac >RME Babyface pro/ Mytek Brooklyn DAC > Rogue Audio Cronus Magnum III (KT120) >Magnepan 1.7i  

2: TV qled 55"/ Roon> Advance Acoustics MyConnect 50 > Kef LS50 Meta.  

"I've looked at life from both sides nowFrom win and lose and still somehowIt's life's illusions I recallI really don't know life at all" Joni Mitchell

Enlace al comentario
Compartir en otros sitios


“Our understanding of natural soundscapes, reverberation, animal vocalisations and speech, requires adjustable time/frequency balances which, up until now, have not been adequately accounted for in audio system design.[10]
This all suggests that the time-domain acuity of the human auditory system has been more important than frequency-domain acuity and explains why its time-frequency uncertainty is so much superior to that of an FFT analyser (and its close relative, the sinc-kernel of digital sampling). Causal signals are key to our achieving this feat; if natural signal waveforms are time-reversed we can no longer outperform the time-frequency uncertainty of Fourier analysis.[11]” About MQA (for JAS) Bob Stuart, Keith Howard. JAS Journal 2015 Vol.55 No.5

 

1: Audioquest Niagara 3000 >CD Sony XA50ES / Rega Planar 3, AT-OC9XML, Moon 110LP / Macmini (Tidal+Roon) > Theoretica BACCH4Mac >RME Babyface pro/ Mytek Brooklyn DAC > Rogue Audio Cronus Magnum III (KT120) >Magnepan 1.7i  

2: TV qled 55"/ Roon> Advance Acoustics MyConnect 50 > Kef LS50 Meta.  

"I've looked at life from both sides nowFrom win and lose and still somehowIt's life's illusions I recallI really don't know life at all" Joni Mitchell

Enlace al comentario
Compartir en otros sitios

Aproveché que estoy repasando programación OOP en Python para hacer unas rutinitas para manejar señales, y hacerle algunas transformadas Fourier, ya que se ha puesto tan de moda el asunto acá. Para los que saben de esto puede ser básico y aburrido. Para lo que sabemos menos, es bien entretenido...

Primero una señal con una fundamental, 3 armónicos en fase, y un agregado de ruido aleatorio de menor amplitud. La señal compuesta es la negra, la roja es la misma con el ruido agregado. En punteado está en azul la fundamental y sus armónicos. Se ve que están todos en fase porque el origen de todas las sinusoides (y de la onda resultante) es el mismo. En gris claro un ruido completamente aleatorio, bastante grande en amplitud respecto de las señales, que implica la "suciedad" de la onda resultante en rojo. 

Figure-2022-08-31-191906-2.png

Como yo programé esto sé que ondas componen esta señal (por lo demás están en el gráfico, las punteadas). Pero si no lo supiera, mediante FFT se puede averiguar:

Figure-2022-08-31-191906-1.png

Revelando el FFT que la fundamental  es de 100 Hz, y con tres armónicos de amplitudes decrecientes (en 200, 300, y 500 hz). El ruido que se veía tremendo en el otro gráfico es apenas visible como un temblor basal acá, teóricamente poco importante. (notar que la escala vertical esta lineal y no logaritmica, como sería para mostrar esto en dB).

Esta señal esta "sampleada" a densidad CD (44.1 Hz), pero en rigor habría que "cuantificarla" (a alguna resolución de 16 o 24 bits por ejemplo; tengo pendiente programar esa clase), ya que ahora la coordenada vertical de cada sampling no está discreteado, sino es un número real. Sí está discretizado en horizontal, obviamente, por el sampling adoptado. Cuando lo haga se podría comprobar hasta qué punto es un mito esto de las redondeces de señales de mayores sampling...

Otra cosa interesante es como el simple hecho de cambiarle las fases a un par de armónicos (el primero a 30 grados, el segundo a 45 grados; los armónicos verde y púrpura), modifica en forma importante la onda resultante. Un problema muy típico en audio y que durante mucho tiempo se consideró irrelevante. Los famosos filtros que hemos discutido pueden (dependiendo de su diseño) generar importantes modificaciones de fase en los armónicos de una señal. Espero seguir mis ejercicios programando algunos filtros, el cuantificador (del cual obtendría además el "error de cuantificación" como otros curva de los gráficos), y algún brickwall . Comparar la onda compuesta del sgte gráfico con el primero, distintas solo por haber corrido la fase cie dos armónicos :

Figure-2022-08-31-191906-0.png

La descomposición Fourier es igual a la anterior, pues son las mismas ondas. Creo que con un "windowing" en el FFT (pero no estoy seguro) debieran cambiar las amplitudes de sos armónicos en su descomposición. Pero eso me queda grande por ahora.

Nótese que el paso temporal de estos gráficos es de 2 milisegundos (que representan unos 88 samplings de un CD). Para ver los "ringing" provocados por filtros (cuando los programe), hay que mostrarlo en un zoom de unos 100 o 1000 veces mayor (todo el gráfico debeiera abarcar unos 50 samplings a lo más).

Con Python todo lo mostrado se resuelve en pocas líneas, el código comentado tiene como 130 apenas. Muy choro. Había hecho varios años antes en R, pero me gustó más en Python.

 

1: Audioquest Niagara 3000 >CD Sony XA50ES / Rega Planar 3, AT-OC9XML, Moon 110LP / Macmini (Tidal+Roon) > Theoretica BACCH4Mac >RME Babyface pro/ Mytek Brooklyn DAC > Rogue Audio Cronus Magnum III (KT120) >Magnepan 1.7i  

2: TV qled 55"/ Roon> Advance Acoustics MyConnect 50 > Kef LS50 Meta.  

"I've looked at life from both sides nowFrom win and lose and still somehowIt's life's illusions I recallI really don't know life at all" Joni Mitchell

Enlace al comentario
Compartir en otros sitios

De verdad me parece admirable ver gente programando por gusto. Yo que trabajo en eso, dificilmente me pondria a programar algo relacionado con mi hobby. Quizas en el alma no soy un verdadero programador 😊

A propósito de armónicos, ondas y FFT, hace unos días leí un comentario que me pareció un típico mito audiófilo. Era asi como "el cable de audífono X tiene mejores armónicos".

Hasta donde entiendo, para el cable los armónicos no existen, lo que va por el cable es solo una onda que en nuestro cerebro se descompone en forma similar a lo que hace la FFT.

Aun asumiendo que el cable es "mejor", no existe forma de que mejore o transmita de mejor forma los armónicos específicamente.

Es correcto?

 

 

We all complete. Maybe none of us really understand what we've lived through, or feel we've had enough time.

 

Enlace al comentario
Compartir en otros sitios

On 28-08-2022 at 13:02, pbanados dijo:

Como sabemos, en el foro tenemos un experto en FFT que se estima suficientemente conocedor del tema como para cuestionar a los autores de varios de los de papers de relevancia mundial en procesamiento de señales de audio (Gerzon, Craven, Stuart). Pensé que podría ser autor de alguno de ellos y me puse a buscar qué chilenos han escrito papers importantes en el tema; pero encontré solo un (por lo demás co-autor de uno de los papers en links en un post anterior): Milan Derpich, profe de U Santa María, doctor en matemáticas, laureado por la U the NewCastle (Australia, mejor tesis de doctorado), que trabajó en investigación en varios temas muy sofisticados de procesamiento de señales mencionados al pasar acá, y al parecer muy aficionado a la música.

Habría sido encachado haberlo invitado a que complementara nuestros balbuceos acá. Lamentablemente falleció hace tres meses atrás. 

https://usm.cl/noticias/homenaje-a-milan-derpich-musa-q-e-p-d/

https://noticias.usm.cl/2010/06/10/universidad-de-newcastle-distingue-a-investigador-del-departamento-de-electronica/

Que lamentable. Al parecer el tipo era extraordinariamente capo, y muy simpático por lo que cuentan.

 

Uhh, chico el mundo. Milan fue ayudante mío de física en la UTFSM iba un par de años más arriba que yo. Un tipo excelente tanto en lo buena onda con los alumnos como en su capacidad. Seco en todo sentido. Lamentablemente falleció hace unos meses atrás de ELA (sí lo mismo que tenía Hawking).

Editado por Bozon
Enlace al comentario
Compartir en otros sitios

hace 10 horas, guax dijo:

De verdad me parece admirable ver gente programando por gusto. Yo que trabajo en eso, dificilmente me pondria a programar algo relacionado con mi hobby. Quizas en el alma no soy un verdadero programador 😊

A propósito de armónicos, ondas y FFT, hace unos días leí un comentario que me pareció un típico mito audiófilo. Era asi como "el cable de audífono X tiene mejores armónicos".

Hasta donde entiendo, para el cable los armónicos no existen, lo que va por el cable es solo una onda que en nuestro cerebro se descompone en forma similar a lo que hace la FFT.

Aun asumiendo que el cable es "mejor", no existe forma de que mejore o transmita de mejor forma los armónicos específicamente.

Es correcto?

 

 

jaja.. no es estrictamente por gusto (pero en el fondo, si....). Es porque necesito actualizar mi minúsculo conocimiento en programación orientada a objetos, y Python en general. A sí que aproveché esta discusión para practicar.

Igual uno da cuenta de cuan poco sabe de esto de señales. Por ejemplo, siempre se discute del rango dinámico que permite una determinada profundidad de bits: 93db en un CD por ejemplo, 144 db en 24 bits (obviando el "pequeño" problema del ruido, que jamás permite realmente ese rango dinámico teórico). Entonces cuando se muestran ondas discretizadas se empiezan a distribuir esa cuantificación total en la onda, como si, en el supuesto que esa vista en particular fuera el máximo rango dinámico de la grabación (supongamos por un momento que es así, esos peas y dips son los máximos peak y dips que encontraremos).  Eso implicaría que si uno sube el volumen, está "estirando" las ondas para valles más abajo, picos más arriba; no "desplazando" esa onda íntegra más arriba. Entonces... los "valles" de la onda se hunden en el ruido basal? Y no debiera mostrarse la onda en escala logarítmica en vez de lineal?

Para percatarse de las implicancias de una u otra cosa, agregué una pequeña subrutina para Mostar las ondas y el FFT en escala logarítitmca (sé que en FFT eso es correcto, sospecho que entonces en tiempo tb lo debiera ser). Acá por ejemplo un gráfico de una onda con varios armónicos y el ruido de menos amplitud que en los ejemplos anteriores, en escala lineal:

Figure-2022-09-01-221426.png

Luego eso mismo en descomposición FFT, mostrando los armónicos, y el ruido. Pero ahora en escala logarítmica, donde se aprecia mejor el nivel de ruido, aún  siendo 4 veces menos que en los gráficos que puse ayer:

Figure-2022-09-01-221436.png

Y finalmente el gráfico temporal, pero en escala logarítmica, que si uno se compra la explicación del rango dinámico distribuido en la onda, debiera ser la vista correcta. El cambio respecto a la lineal es tremendo. Créanlo o no, es exactamente la misma información de los otros dos:

Figure-2022-09-01-221441.png

Obviamente. algo me está faltando en todo esto. Por ejemplo, si la distribución logarítmica es la realista a lo que uno escucha, ¿no se debiera cuantificar logaritmicamente tb? Todo esto me interesó porque quiero programar ahora el "cuantificado" de estas ondas, y hay que ver el criterio con que se aplica.

En fin, me he entretenido harto con el juguetito, para que andamos con cosas...

 

Editado por pbanados

1: Audioquest Niagara 3000 >CD Sony XA50ES / Rega Planar 3, AT-OC9XML, Moon 110LP / Macmini (Tidal+Roon) > Theoretica BACCH4Mac >RME Babyface pro/ Mytek Brooklyn DAC > Rogue Audio Cronus Magnum III (KT120) >Magnepan 1.7i  

2: TV qled 55"/ Roon> Advance Acoustics MyConnect 50 > Kef LS50 Meta.  

"I've looked at life from both sides nowFrom win and lose and still somehowIt's life's illusions I recallI really don't know life at all" Joni Mitchell

Enlace al comentario
Compartir en otros sitios

hace 13 minutos, Bozon dijo:

Uhh, chico el mundo. Milan fue ayudante mío de física en la UTFSM iba un par de años más arriba que yo. Un tipo excelente tanto en lo buena onda con los alumnos como en su capacidad. Seco en todo sentido. Lamentablemente falleció hace unos meses atrás de ELA (sí lo mismo que tenía Hawking).

wow... ese gallo si que nos podría haber enseñado un par de cosas si hubiera estado acá.... que pena.

1: Audioquest Niagara 3000 >CD Sony XA50ES / Rega Planar 3, AT-OC9XML, Moon 110LP / Macmini (Tidal+Roon) > Theoretica BACCH4Mac >RME Babyface pro/ Mytek Brooklyn DAC > Rogue Audio Cronus Magnum III (KT120) >Magnepan 1.7i  

2: TV qled 55"/ Roon> Advance Acoustics MyConnect 50 > Kef LS50 Meta.  

"I've looked at life from both sides nowFrom win and lose and still somehowIt's life's illusions I recallI really don't know life at all" Joni Mitchell

Enlace al comentario
Compartir en otros sitios

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.

Invitado
Responder en este tema...

×   Pasted as rich text.   Paste as plain text instead

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.

×
×
  • Crear Nuevo...