Cómo usar WhisperX en Google Colab (2025)

WhisperX es un pipeline avanzado de reconocimiento de voz construida sobre Whisper, el modelo ASR de código abierto de OpenAI. Funciona en PyTorch y, aunque puede operar sobre CPU, el rendimiento mejora muchísimo con una GPU compatible con CUDA (es decir, NVIDIA). WhisperX mejora al modelo original con una alineación más precisa y veloz, soporte para modelos más grandes y diferenciación de voces (diarización) opcional. El resultado son transcripciones de alta calidad con marcas de tiempo a nivel de palabra e identificación clara de cada hablante y asegura ser hasta 70x más rápìdo que el modelo original

Mi compu no tiene una GPU con soporte para CUDA, así que ejecuto WhisperX en Google Colab y este es un tutorial corto de cómo lo configuro y uso en ese entorno en la nube.

Leer más…

textual-tetris, un tetris en la terminal

Como sigo sin empleo priorizando la búsqueda de salud mental, dedico mi tiempo ñoño a dos loables tareas:

  1. Colaborar con organizaciones que necesitan soluciones tecnológicas pero no tienen el presupuesto para competir con el mercado por mis conocimientos.
  2. La que compete a este post: aprender cosas nuevas implementando ideas viejas del TO DO permanente que anoto acá), para las que rara vez encontraba el tiempo.

Esta vez quería aprender un poco sobre Textual (hermano mayor de rich), el gran framework en Python para hacer interfaces gráficas basadas en texto, las famosas TUIs.

Y ya que estaba, aprendí a hacer un Tetris que es bastante digno de jugar, no se ve taaan feo, y actualmente tiene menos de 600 líneas contando los comentarios y se ve así:

Pero una probadita vale más que mil capturas: abrí una terminal y si tenés uv instalado (¡deberías!) ejecutá:

uvx textual-tetris 

Y ya estás jugando Tetris!

Leer más…

Analizando la migración intraprovincial en Córdoba

Charlando hace poco con Facundo Cruz, sociólogo investigador del Equipo de Investigación Política de la Revista Crisis (EdIPo), le conté sobre un estudio "en joda" que hice una vez, el padronazo cordobés, y recordé un trabajo más útil que supimos hacer desde Open Data Córdoba y que suele ser un tema de interés en la prensa local: analizar migraciones dentro de la provincia de Córdoba basado en los cambios de domicilio, según los padrones electorales. Como Facu se emocionó cuando le explicaba, le prometí que, si me conseguía el último padrón, se lo actualizaría. Así que empecemos por el final. Quedó así:

Leer más…

richterm, capturando la terminal a todo color

Siempre estoy haciendo programitas de línea de comando y siempre quiero mostrar como se ve el resultado de algun comando. Si bien es texto que puedo copiar y pegar, muchas veces prefiero tomar capturas de pantalla de la terminal para mostrar como se ve el resultado, especialmente si tiene colores o algun formato especial.

Cuando estaba escribiendo este post necesitaba una captura, y encontré una manera de hacerlo:

x.com//1983986531972116685

El truco que propuse ahí es usar rich-codex pero, a decir verdad, la CLI de esta herramienta es un bastante complicada para este caso súper común: sólo quiero ejecutar un comando y quedarme con un SVG listo para incrustar en un post o en la documentación.

Así que me armé una mini herramienta más simple: richterm.

Leer más…

Easter-eggs en tu código con texto invisible

Según Wikipedia en español, un "easter egg" es ...

un mensaje o capacidad oculta contenido en películas, series de televisión, ..., programas informáticos o videojuegos. Entre los programadores, parece haber una motivación en dejar una marca personal, casi un toque artístico sobre un producto intelectual, el cual es por naturaleza estándar y funcional. Actualmente, los huevos de Pascua tratan de entretener, buscar nuevos trabajos potenciales, pagar tributo a los ejecutivos o divertir a los programadores.

No sé a quien le hizo creer eso de que un software es "estándar y funcional" al crédulo wikipedista, pero es verdad que la pulsión por poner huevos de pascua en el software es casi tan vieja como el software mismo.

Acá les traigo una técnica que yo descubrí hace varias décadas, en el jardín de infantes cuando dibujabamos con jugo de limón en una hoja en blanco para que más tarde, mágicamente, se revelara el garabato al calor del encendedor de la seño que seguramente había estado fumando en el rincón de las maderitas un rato antes.

Veamos entonces como escribir mensajes en texto (digital) invisible: jugo de limón en su versión unicode.

Leer más…