Cómo extraer imágenes, texto y archivos incrustados de documentos de Word, Excel y PowerPoint

Digamos que alguien te envió un documento de Word con muchas imágenes y quieres que las guardes en tu disco duro. Puede extraer imágenes de un documento de Microsoft Office con un simple truco.

Si tiene un archivo de Word (.docx), Excel (.xlsx) o PowerPoint (.pptx) con imágenes u otros archivos incrustados, puede extraerlos (así como el texto del documento), sin tener que guardar cada uno por separado. . Y lo mejor de todo es que no necesita ningún software adicional. Los formatos de archivo basados ​​en XML de Office (docx, xlsx y pptx) son en realidad archivos comprimidos que puede abrir como cualquier archivo .zip normal con Windows. Desde allí, puede extraer imágenes, texto y otros archivos incrustados. Puede usar el soporte .zip integrado de Windows o una aplicación como 7-Zip si lo prefiere.

Si necesita extraer archivos de un documento de Office más antiguo, como un archivo .doc, .xls o .ppt, puede hacerlo con una pequeña pieza de software gratuito. Detallaremos ese proceso al final de esta guía.

Cómo extraer el contenido de un archivo de Office más nuevo (.docx, .xlsx o .pptx)

Para acceder al contenido interno de un documento de Office basado en XML, abra el Explorador de archivos (o el Explorador de Windows en Windows 7), navegue hasta el archivo del que desea extraer el contenido y seleccione el archivo.

Presione «F2» para cambiar el nombre del archivo y cambiar la extensión (.docx, .xlsx o .pptx) a «.zip». Deja la parte principal del nombre del archivo solo. Presione «Enter» cuando haya terminado.

El siguiente cuadro de diálogo muestra una advertencia sobre el cambio de la extensión del nombre de archivo. Haga clic en «Sí».

Windows reconoce automáticamente el archivo como un archivo comprimido. Para extraer el contenido del archivo, haga clic con el botón derecho en el archivo y seleccione «Extraer todo» en el menú emergente.

En el cuadro de diálogo «Seleccionar un destino y extraer archivos», la ruta donde se extraerá el contenido del archivo .zip se muestra en el cuadro de edición «Los archivos se extraerán en esta carpeta». De forma predeterminada, se crea una carpeta con el mismo nombre que el nombre del archivo (sin la extensión del archivo) en la misma carpeta que el archivo .zip. Para extraer los archivos a una carpeta diferente, haga clic en «Examinar».

Navegue hasta donde desee extraer el contenido del archivo .zip y haga clic en «Nueva carpeta» para crear una nueva carpeta, si es necesario. Haga clic en «Seleccionar carpeta».

Para abrir una ventana del Explorador de archivos (o Explorador de Windows) con la carpeta que contiene los archivos extraídos que se muestran una vez extraídos, seleccione la casilla de verificación «Mostrar archivos extraídos cuando estén completos» para que haya una marca de verificación en la casilla. Haga clic en «Extraer».

Cómo acceder a las imágenes extraídas

Incluido en el contenido extraído es una carpeta llamada «palabra», si su archivo original es un documento de Word (o «xl» para un documento de Excel o «ppt» para un documento de PowerPoint). Haga doble clic en la carpeta «palabra» para abrirla.

Haga doble clic en la carpeta «medios».

Todas las imágenes del archivo original están en la carpeta «media». Los archivos extraídos son las imágenes originales utilizadas por el documento. Dentro del documento, puede haber un cambio de tamaño u otras propiedades establecidas, pero los archivos extraídos son las imágenes sin procesar sin estas propiedades aplicadas.

Cómo acceder al texto extraído

Si no tiene Office instalado en su PC y necesita extraer texto de un archivo de Word (o Excel o PowerPoint), puede acceder al texto extraído en el archivo «document.xml» en la carpeta «word» .

Puede abrir este archivo en un editor de texto, como Notepad o WordPad, pero es más fácil de leer en un editor XML especial, como el programa gratuito XML Notepad . Todo el texto del archivo está disponible en fragmentos de texto sin formato, independientemente del estilo y / o formato aplicado en el documento. Por supuesto, si va a descargar software gratuito para ver este texto, también puede descargar LibreOffice , que puede leer documentos de Microsoft Office.

Cómo extraer objetos OLE incrustados o archivos adjuntos

Para acceder a archivos incrustados en un documento de Word cuando no tiene acceso a Word, primero abra el archivo de Word en WordPad (que viene integrado en Windows). Es posible que observe que algunos de los íconos de archivos incrustados no se muestran, pero siguen ahí. Algunos de los archivos incrustados pueden tener nombres de archivo parciales. WordPad no es compatible con todas las funciones de Word, por lo que es posible que parte del contenido se muestre de forma incorrecta. Pero debería poder acceder a los archivos.

Si hacemos clic derecho en uno de los archivos incrustados en nuestro archivo de Word de muestra, una de las opciones es “Abrir objeto PDF”. Esto abre el archivo PDF en el programa de lectura de PDF predeterminado en su PC. Desde allí, puede guardar el archivo PDF en su disco duro.

Si WordPad no tiene una opción para abrir su archivo, tome nota de su tipo de archivo aquí. Por ejemplo, nuestro segundo archivo en este documento es un archivo .mp3.

Luego, regrese a su carpeta «Archivos de [Documento]» y haga doble clic en la carpeta «incrustaciones» dentro de la carpeta «palabra».

Desafortunadamente, los tipos de archivo no se conservan en los nombres de archivo. En su lugar, todos tienen una extensión de archivo «.bin». Si sabe qué tipos de archivos están incrustados en el archivo, probablemente pueda deducir qué archivo es cuál por el tamaño del archivo. En nuestro ejemplo, teníamos un archivo PDF y un archivo MP3 incrustados en nuestro documento. Debido a que el archivo MP3 probablemente sea más grande que el archivo PDF, podemos averiguar qué archivo es cuál mirando los tamaños de los archivos y luego renombrarlos usando las extensiones correctas. A continuación, cambiamos el nombre del archivo MP3.

Tenga en cuenta que no todos los archivos se abrirán necesariamente mediante este proceso; por ejemplo, nuestro archivo PDF se abrió correctamente desde WordPad, pero no pudimos abrirlo cambiando el nombre de su archivo .bin.

Una vez que haya extraído el contenido del archivo comprimido, puede revertir la extensión del archivo original a .docx, .xlsx o .pptx. El archivo permanecerá intacto y podrá abrirse normalmente en el programa correspondiente.

Cómo extraer imágenes de documentos de Office más antiguos (.doc, .xls o .ppt)

Si necesita extraer imágenes de un documento de Office 2003 (o anterior), existe una herramienta gratuita llamada Asistente de extracción de imágenes de Office que facilita esta tarea. Este programa también le permite extraer imágenes de varios documentos (del mismo tipo o de diferentes tipos) a la vez. Descargue el programa e instálelo (también hay una versión portátil disponible si prefiere no instalarlo).

Ejecute el programa y aparecerá la pantalla de bienvenida. Haga clic en Siguiente».

Primero, debemos seleccionar el archivo del que desea extraer las imágenes. En la pantalla de entrada y salida, haga clic en el botón «Examinar» (icono de carpeta) a la derecha del cuadro de edición del documento.

Navegue hasta la carpeta que contiene el documento que desea, selecciónelo y haga clic en «Abrir».

La carpeta que contiene el archivo seleccionado se convierte automáticamente en la carpeta de salida. Para crear una subcarpeta dentro de esa carpeta con el mismo nombre que el archivo seleccionado, haga clic en la casilla de verificación «Crear una carpeta aquí» para que haya una marca de verificación en la casilla. Luego, haga clic en «Siguiente».

En la pantalla Listo para comenzar, haga clic en “Iniciar” para comenzar a extraer las imágenes.

La siguiente pantalla se muestra mientras se procesa la extracción.

En la pantalla Finalizado, haga clic en «Haga clic aquí para abrir la carpeta de destino» para ver los archivos de imagen resultantes.

Debido a que elegimos crear una subcarpeta, obtenemos una carpeta que contiene los archivos de imagen extraídos del archivo.

Verá todas las imágenes como archivos numerados.

También puede extraer imágenes de varios archivos a la vez. Para hacer esto, en la pantalla de Entrada y Salida, haga clic en la casilla de verificación «Modo por lotes» para que haya una marca de verificación en la casilla.

Aparece la pantalla Entrada y salida por lotes. Haga clic en «Agregar archivos».

En el cuadro de diálogo Abrir, navegue hasta la carpeta que contiene cualquiera de los archivos de los que desea extraer imágenes, seleccione los archivos usando la tecla «Shift» o «Ctrl» para seleccionar varios archivos y haga clic en «Abrir».

Puede agregar archivos desde otra carpeta haciendo clic en “Agregar archivos” nuevamente, navegando a la carpeta en el cuadro de diálogo Abrir, seleccionando los archivos deseados y haciendo clic en “Abrir”.

Una vez que haya agregado todos los archivos de los que desea extraer las imágenes, puede optar por crear una carpeta separada para cada documento dentro de la misma carpeta que cada documento en el que se guardarán los archivos de imagen haciendo clic en «Crear una carpeta para cada casilla de verificación de documento ”para que haya una marca de verificación en la casilla.

También puede especificar que la carpeta de salida sea «Igual que la carpeta de entrada de cada archivo» o ingresar o seleccionar una carpeta personalizada usando el cuadro de edición y el botón «Examinar» debajo de esa opción. Haga clic en «Siguiente» una vez que haya seleccionado las opciones que desee.

Haga clic en «Inicio» en la pantalla Listo para comenzar.

Aparece la siguiente pantalla que muestra el progreso de la extracción.

El número de imágenes extraídas se muestra en la pantalla Finalizado. Haga clic en «Cerrar» para cerrar el Asistente de extracción de imágenes de Office.

Si elige crear una carpeta separada para cada documento, verá carpetas con los mismos nombres que los archivos que contienen las imágenes, cualquiera que sea la carpeta de salida que especificó.

Nuevamente, obtenemos todas las imágenes como archivos numerados para cada documento.

Ahora puede cambiar el nombre de las imágenes, moverlas y utilizarlas en sus propios documentos. Solo asegúrese de tener los derechos para usarlos legalmente.

responroot

Entradas recientes

Steamlytics: La nueva herramienta imprescindible para los gamers de Steam

  El mundo del gaming ha experimentado un crecimiento exponencial en los últimos años. La…

8 meses hace

Cuándo reemplazar su antigua unidad flash USB

Stokkete/Shutterstock.com ¿Sigue utilizando una unidad flash USB obsoleta para almacenar sus archivos? ¿Por qué no…

2 años hace

¿Qué es una pantalla Nano IPS?

LG Los fabricantes siempre intentan mejorar el rendimiento de imagen de los monitores. Como resultado,…

2 años hace

10 formas de jugar con un presupuesto bajo (o nulo)

Patty Chan/Shutterstock.com Si cree en lo que ve en las redes sociales, puede pensar en…

2 años hace

¿Demasiadas suscripciones? Aquí está cómo empezar a cortarlos

Seksan.TH/Shutterstock.com Los servicios de suscripción como Netflix, Game Pass y Spotify nos permiten consumir tantas…

2 años hace

Cómo configurar la puerta de enlace predeterminada en Linux

fatmawati achmad zaenuri/Shutterstock El acceso a Internet, oa cualquier otra red, se rige por la…

2 años hace