Cómo extraer imágenes, texto y archivos incrustados de documentos de Word, Excel y PowerPoint

00_lead_image_extract_images_from_word_file

Digamos que alguien te envió un documento de Word con muchas imágenes y quieres que las guardes en tu disco duro. Puede extraer imágenes de un documento de Microsoft Office con un simple truco.

Si tiene un archivo de Word (.docx), Excel (.xlsx) o PowerPoint (.pptx) con imágenes u otros archivos incrustados, puede extraerlos (así como el texto del documento), sin tener que guardar cada uno por separado. . Y lo mejor de todo es que no necesita ningún software adicional. Los formatos de archivo basados ​​en XML de Office (docx, xlsx y pptx) son en realidad archivos comprimidos que puede abrir como cualquier archivo .zip normal con Windows. Desde allí, puede extraer imágenes, texto y otros archivos incrustados. Puede usar el soporte .zip integrado de Windows o una aplicación como 7-Zip si lo prefiere.

Si necesita extraer archivos de un documento de Office más antiguo, como un archivo .doc, .xls o .ppt, puede hacerlo con una pequeña pieza de software gratuito. Detallaremos ese proceso al final de esta guía.

Cómo extraer el contenido de un archivo de Office más nuevo (.docx, .xlsx o .pptx)

Para acceder al contenido interno de un documento de Office basado en XML, abra el Explorador de archivos (o el Explorador de Windows en Windows 7), navegue hasta el archivo del que desea extraer el contenido y seleccione el archivo.

01_pressing_f2_to_rename_file

Presione «F2» para cambiar el nombre del archivo y cambiar la extensión (.docx, .xlsx o .pptx) a «.zip». Deja la parte principal del nombre del archivo solo. Presione «Enter» cuando haya terminado.

02_cambiar_extensión_a_zip

El siguiente cuadro de diálogo muestra una advertencia sobre el cambio de la extensión del nombre de archivo. Haga clic en «Sí».

02a_rename_confirmation

Windows reconoce automáticamente el archivo como un archivo comprimido. Para extraer el contenido del archivo, haga clic con el botón derecho en el archivo y seleccione «Extraer todo» en el menú emergente.

03_selecting_extract_all

En el cuadro de diálogo «Seleccionar un destino y extraer archivos», la ruta donde se extraerá el contenido del archivo .zip se muestra en el cuadro de edición «Los archivos se extraerán en esta carpeta». De forma predeterminada, se crea una carpeta con el mismo nombre que el nombre del archivo (sin la extensión del archivo) en la misma carpeta que el archivo .zip. Para extraer los archivos a una carpeta diferente, haga clic en «Examinar».

04_click_browse

Navegue hasta donde desee extraer el contenido del archivo .zip y haga clic en «Nueva carpeta» para crear una nueva carpeta, si es necesario. Haga clic en «Seleccionar carpeta».

05_creando_nueva_carpeta_y_seleccionando_la

Para abrir una ventana del Explorador de archivos (o Explorador de Windows) con la carpeta que contiene los archivos extraídos que se muestran una vez extraídos, seleccione la casilla de verificación «Mostrar archivos extraídos cuando estén completos» para que haya una marca de verificación en la casilla. Haga clic en «Extraer».

06_extracto_click

Cómo acceder a las imágenes extraídas

Incluido en el contenido extraído es una carpeta llamada «palabra», si su archivo original es un documento de Word (o «xl» para un documento de Excel o «ppt» para un documento de PowerPoint). Haga doble clic en la carpeta «palabra» para abrirla.

07_opening_word_folder

Haga doble clic en la carpeta «medios».

08_opening_media_folder

Todas las imágenes del archivo original están en la carpeta «media». Los archivos extraídos son las imágenes originales utilizadas por el documento. Dentro del documento, puede haber un cambio de tamaño u otras propiedades establecidas, pero los archivos extraídos son las imágenes sin procesar sin estas propiedades aplicadas.

09_images_from_file

Cómo acceder al texto extraído

Si no tiene Office instalado en su PC y necesita extraer texto de un archivo de Word (o Excel o PowerPoint), puede acceder al texto extraído en el archivo «document.xml» en la carpeta «word» .

10_document_xml_file

Puede abrir este archivo en un editor de texto, como Notepad o WordPad, pero es más fácil de leer en un editor XML especial, como el programa gratuito XML Notepad . Todo el texto del archivo está disponible en fragmentos de texto sin formato, independientemente del estilo y / o formato aplicado en el documento. Por supuesto, si va a descargar software gratuito para ver este texto, también puede descargar LibreOffice , que puede leer documentos de Microsoft Office.

11_document_xml_file_open_in_xml_notepad

Cómo extraer objetos OLE incrustados o archivos adjuntos

Para acceder a archivos incrustados en un documento de Word cuando no tiene acceso a Word, primero abra el archivo de Word en WordPad (que viene integrado en Windows). Es posible que observe que algunos de los íconos de archivos incrustados no se muestran, pero siguen ahí. Algunos de los archivos incrustados pueden tener nombres de archivo parciales. WordPad no es compatible con todas las funciones de Word, por lo que es posible que parte del contenido se muestre de forma incorrecta. Pero debería poder acceder a los archivos.

Si hacemos clic derecho en uno de los archivos incrustados en nuestro archivo de Word de muestra, una de las opciones es “Abrir objeto PDF”. Esto abre el archivo PDF en el programa de lectura de PDF predeterminado en su PC. Desde allí, puede guardar el archivo PDF en su disco duro.

11a_opening_pdf_file

Si WordPad no tiene una opción para abrir su archivo, tome nota de su tipo de archivo aquí. Por ejemplo, nuestro segundo archivo en este documento es un archivo .mp3.

Luego, regrese a su carpeta «Archivos de [Documento]» y haga doble clic en la carpeta «incrustaciones» dentro de la carpeta «palabra».

12_embeddings_folder

Desafortunadamente, los tipos de archivo no se conservan en los nombres de archivo. En su lugar, todos tienen una extensión de archivo «.bin». Si sabe qué tipos de archivos están incrustados en el archivo, probablemente pueda deducir qué archivo es cuál por el tamaño del archivo. En nuestro ejemplo, teníamos un archivo PDF y un archivo MP3 incrustados en nuestro documento. Debido a que el archivo MP3 probablemente sea más grande que el archivo PDF, podemos averiguar qué archivo es cuál mirando los tamaños de los archivos y luego renombrarlos usando las extensiones correctas. A continuación, cambiamos el nombre del archivo MP3.

13_archivos_emberados_extractos

Tenga en cuenta que no todos los archivos se abrirán necesariamente mediante este proceso; por ejemplo, nuestro archivo PDF se abrió correctamente desde WordPad, pero no pudimos abrirlo cambiando el nombre de su archivo .bin.

Una vez que haya extraído el contenido del archivo comprimido, puede revertir la extensión del archivo original a .docx, .xlsx o .pptx. El archivo permanecerá intacto y podrá abrirse normalmente en el programa correspondiente.

Cómo extraer imágenes de documentos de Office más antiguos (.doc, .xls o .ppt)

Si necesita extraer imágenes de un documento de Office 2003 (o anterior), existe una herramienta gratuita llamada Asistente de extracción de imágenes de Office que facilita esta tarea. Este programa también le permite extraer imágenes de varios documentos (del mismo tipo o de diferentes tipos) a la vez. Descargue el programa e instálelo (también hay una versión portátil disponible si prefiere no instalarlo).

Ejecute el programa y aparecerá la pantalla de bienvenida. Haga clic en Siguiente».

14_pantalla_de_bienvenida

Primero, debemos seleccionar el archivo del que desea extraer las imágenes. En la pantalla de entrada y salida, haga clic en el botón «Examinar» (icono de carpeta) a la derecha del cuadro de edición del documento.

15_click_browse_for_document

Navegue hasta la carpeta que contiene el documento que desea, selecciónelo y haga clic en «Abrir».

16_opening_word_file

La carpeta que contiene el archivo seleccionado se convierte automáticamente en la carpeta de salida. Para crear una subcarpeta dentro de esa carpeta con el mismo nombre que el archivo seleccionado, haga clic en la casilla de verificación «Crear una carpeta aquí» para que haya una marca de verificación en la casilla. Luego, haga clic en «Siguiente».

17_haciendo clic_siguiente

En la pantalla Listo para comenzar, haga clic en “Iniciar” para comenzar a extraer las imágenes.

18_ready_to_start

La siguiente pantalla se muestra mientras se procesa la extracción.

19_processing_please_wait

En la pantalla Finalizado, haga clic en «Haga clic aquí para abrir la carpeta de destino» para ver los archivos de imagen resultantes.

20_opening_destination_folder

Debido a que elegimos crear una subcarpeta, obtenemos una carpeta que contiene los archivos de imagen extraídos del archivo.

21_opening_subfolder

Verá todas las imágenes como archivos numerados.

22_images_from_older_word_file

También puede extraer imágenes de varios archivos a la vez. Para hacer esto, en la pantalla de Entrada y Salida, haga clic en la casilla de verificación «Modo por lotes» para que haya una marca de verificación en la casilla.

23_clicking_batch_mode

Aparece la pantalla Entrada y salida por lotes. Haga clic en «Agregar archivos».

24_clicking_add_files

En el cuadro de diálogo Abrir, navegue hasta la carpeta que contiene cualquiera de los archivos de los que desea extraer imágenes, seleccione los archivos usando la tecla «Shift» o «Ctrl» para seleccionar varios archivos y haga clic en «Abrir».

Puede agregar archivos desde otra carpeta haciendo clic en “Agregar archivos” nuevamente, navegando a la carpeta en el cuadro de diálogo Abrir, seleccionando los archivos deseados y haciendo clic en “Abrir”.

25_archivos_apertura

Una vez que haya agregado todos los archivos de los que desea extraer las imágenes, puede optar por crear una carpeta separada para cada documento dentro de la misma carpeta que cada documento en el que se guardarán los archivos de imagen haciendo clic en «Crear una carpeta para cada casilla de verificación de documento ”para que haya una marca de verificación en la casilla.

26_clicking_next_on_batch_mode

También puede especificar que la carpeta de salida sea «Igual que la carpeta de entrada de cada archivo» o ingresar o seleccionar una carpeta personalizada usando el cuadro de edición y el botón «Examinar» debajo de esa opción. Haga clic en «Siguiente» una vez que haya seleccionado las opciones que desee.

26a_specifying_output_folder

Haga clic en «Inicio» en la pantalla Listo para comenzar.

27_ready_to_start_for_batch_mode

Aparece la siguiente pantalla que muestra el progreso de la extracción.

28_pantalla_de_procesamiento

El número de imágenes extraídas se muestra en la pantalla Finalizado. Haga clic en «Cerrar» para cerrar el Asistente de extracción de imágenes de Office.

29_closing_wizard

Si elige crear una carpeta separada para cada documento, verá carpetas con los mismos nombres que los archivos que contienen las imágenes, cualquiera que sea la carpeta de salida que especificó.

30_folders_containing_images

Nuevamente, obtenemos todas las imágenes como archivos numerados para cada documento.

31_images_from_one_file

Ahora puede cambiar el nombre de las imágenes, moverlas y utilizarlas en sus propios documentos. Solo asegúrese de tener los derechos para usarlos legalmente.