Cuando subimos un PDF a un chatbot no solo enviamos el texto, sino también un montón de elementos de formato que consumen tokens de más. Microsoft tiene una solución y te contamos todo sobre MarkItDown. ¡En esta nota!

Si sos de quienes usan un asistente de IA como ChatGPT, Claude o Gemini y le cargás documentos PDF, Word, hojas de cálculo o presentaciones para que analice la información, es probable que no sepas algo: esos formatos suelen llegar a los modelos con elementos de formato innecesarios que consumen contexto y tokens. Ese ruido afecta la capacidad del modelo para entender bien el contenido, recuperar datos relevantes o generar citas precisas, y encima implica un mayor gasto de tokens. Por eso tenemos una solución, que llega de la mano de Microsoft y es gratuita: MarkItDown.
¿Qué es MarkItDown de Microsoft?
Esta herramienta es una librería de Python desarrollada por Microsoft Research que convierte múltiples formatos de archivo a Markdown limpio y estructurado. El objetivo es simplificar el contenido antes de entregárselo a un modelo de lenguaje. Lo bueno es que preserva la jerarquía del documento mediante títulos, listas y tablas, pero elimina gran parte del ruido asociado a formatos como PDF o DOCX. Comenzó como soporte para AutoGen, el multiagente de Microsoft, y después se liberó como proyecto de código abierto. Llegó en 2025 y, en apenas dos semanas, superó las 25.000 estrellas en GitHub. Hoy, tras una gran actualización, acumula más de 138.000.

Uno de los principales atractivos de MarkItDown es la amplia variedad de formatos que soporta. Entre ellos se encuentran documentos de Microsoft Office como DOCX, PPTX, XLSX y XLS; archivos PDF con capa de texto; imágenes JPG y PNG; archivos de audio como MP3 y WAV mediante transcripción; contenido web en formato HTML o directamente desde URLs; videos de YouTube, de los que puede extraer título, descripción y transcripción cuando está disponible; y formatos estructurados como CSV, JSON y XML. También procesa archivos ZIP, convirtiendo automáticamente el contenido que guardan en su interior.
Pero lo más llamativo: el servidor MCP
Una de las incorporaciones de las últimas versiones es markitdown-mcp, un servidor MCP oficial que permite integrar la herramienta directamente con aplicaciones compatibles con el estándar Model Context Protocol. Pero… ¿qué significa esto? Que plataformas como Claude Desktop pueden convertir automáticamente los documentos a Markdown cada vez que los cargamos, sin necesidad de ejecutar scripts manuales.

Si querés probar MarkItDown no hace falta ser programador. Lo único que necesitás es tener Python, que puede descargarse desde su sitio oficial. Con Python instalado, abrís la terminal de Windows y escribís un único comando: pip install “markitdown[all]”. Si no te funciona, también podés instalar la herramienta desde GitHub. Tras unos minutos vas a ver el mensaje de que ya está lista para usar. A partir de ahí, MarkItDown puede convertir archivos como PDF, documentos de Word, presentaciones de PowerPoint o planillas de Excel a Markdown, un formato de texto mucho más limpio y fácil de interpretar para los modelos de inteligencia artificial. En GitHub tenés, además, el tutorial completo con todos los pasos a seguir.
Para ponerlo en Claude incluso podés pedirle a la IA que lo haga por vos con el siguiente prompt: “Instala la herramienta MarkItDown de Microsoft desde https://github.com/microsoft/markitdown en mi computadora. Después úsala cada vez que te pida convertir un archivo (PDF, Word, Excel, PowerPoint, imagen, audio o video) a Markdown antes de leerlo. Avísame cuando termines de instalarla”. Eso sí, tené en cuenta que, a pesar de ser una gran herramienta con el respaldo de Microsoft, no sustituye a las plataformas más avanzadas para el procesamiento de documentos complejos. Además, tiene limitaciones específicas con documentos científicos que incluyen ecuaciones, gráficos y estructuras complejas. Pero para estudiantes o para quienes trabajan con mucho texto sin imágenes complicadas, es una gran opción.
Preguntas frecuentes sobre MarkItDown
¿Para qué sirve MarkItDown? Sirve para convertir archivos como PDF, Word, Excel, PowerPoint, imágenes o audio a Markdown limpio, un formato que los modelos de IA interpretan mejor y con menor consumo de tokens.
¿MarkItDown es gratis y dónde se descarga? Sí, es totalmente gratuita y de código abierto. Se instala con Python mediante el comando pip install “markitdown[all]” o directamente desde su repositorio oficial en GitHub.
¿Cómo ayuda MarkItDown a ahorrar tokens? Al transformar los documentos a Markdown elimina el ruido de formato de PDF y DOCX, por lo que el modelo procesa menos texto innecesario y gasta menos contexto y tokens. Si te interesan otras herramientas potenciadas con IA, no te pierdas nuestra review de la Plaud Note.
@culturageek.com.ar ¿Se habían dado cuenta? #Worldcup #copadomundo #thelastofus #tlou
♬ DAI DAI FIFA WORLD CUP 2026 – Beckham Music & BECKXLKZ & Afro woodz
