Microsoft Word-dokumenter, nesten allestedsnærværende i forretningsinnstillinger, kan betraktes som et nødvendig onde for Linux-brukere å håndtere. Jo, du kan åpne Word-filer i LibreOffice, men det er en smerte å vente på et tungt grafisk program for å laste dokumentet. Antiword er en løsning som går i terminalen din - perfekt for folk på sakte datamaskiner eller systemer uten grafisk miljø.

Antiword har blitt sendt til FreeBSD, BeOS, OS / 2, Mac OS X, Amiga, VMS, NetWare, Plan9, EPOC, Zaurus PDA, MorphOS, Tru64 / OSF, Minix, Solaris og DOS. For denne artikkelen vil jeg fokusere på å bruke den i Linux.

Hovedtrekkene

Antiword lar deg vise og konvertere MS Word-dokumenter fra kommandolinjen. Du kan konvertere til følgende formater:

  • Vanlig tekst
  • Formatert tekst
  • PDF
  • Postscript
  • XML (bare DocBook støttes for øyeblikket)

begrensninger

Før du blir for spent, må jeg nevne at Antiword ble sist oppdatert i 2005 og er ikke kompatibelt med nyere DOCX-dokumenter. Du kan heller ikke bruke den til å redigere dokumentene dine.

Å få Antiword

Hvis Linux-distribusjonen din har en pakkebehandling, kan du mest sannsynlig finne Antiword i en av dine arkiver.

Ellers ta tak i .tar.gz-arkivet fra Antiword-siden på Freecode. Trekk ut arkivet og skriv inn antiword-0.37-katalogen. Kjør deretter:

 gjør sudo gjør installasjon 

bruk

For følgende brukstips skal jeg bruke resuméet mitt som et eksempeldokument. Slik ser det ut i LibreOffice:

Den mest grunnleggende måten å bruke antiword på er å bare vise dokumentet:

 antiword resume.doc 

Som du kan se, beholder standardkommandoen ikke visse aspekter ved formatering som skriftstørrelse, kursiv og understrekking, men det gjør en fin jobb med å presentere teksten i en lesbar form.

For å vise formateringsinformasjon, bruk " -f " -flagget i kommandoen din:

 antiword -f gjenoppta.doc 

Nei, dette viser ikke deg formateringen i en WYSIWYG-stil. heller, det forteller deg om det med en markdown-lignende syntaks. For eksempel viser den _underlined text_ med understreker og * fet tekst * med stjerner.

For å konvertere ditt Word-dokument til en PDF-fil, må du angi en papirstørrelse ved hjelp av " -a " -flagget. Antiword støtter følgende papirstørrelser:

  • 10 x 14
  • a3
  • a4
  • a5
  • b4
  • b5
  • utøvende
  • folio
  • lovlig
  • brev
  • Merk
  • quarto
  • uttalelse
  • tabloid

Du kan bruke de samme papirstørrelsene når du konverterer et dokument til Postscript, men i så fall må du bruke " -p " -flagget i stedet.

Dette eksempelet konverterer dokumentet til en PDF-fil med tabloid-størrelse:

 antiword-a tabloid resume.doc> resume-tabloid.pdf 

Dette er den resulterende PDF-filen som vises i Okular:

Ikke verst! Den stiplede understreken og e-postadressen hyperkoblingen forsvant, men totalt sett var konverteringen vellykket.

Hvis du konverterer til Postscript, kan du også bruke " -L " til å skrive ut i liggende modus.

Dette eksemplet konverterer dokumentet til DocBook-format:

 antiword -x db resume.doc> resume-docbook.docbook 

Konverteringen vil også bevare metadata, inkludert forfatternavn og opprettelsesdato for dokumentet. Slik ser den røde XML ut:

Og her er hva DocBook-filen ser ut i LibreOffice:

Du kan se at den ser annerledes ut enn det originale Word-dokumentet, men strukturen er for det meste bevart. Konvertere til DocBook med Antiword ville trolig fungere bedre med Word-dokumenter som ble opprettet med konvertering til XML i tankene.

For å se hva annet du kan gjøre med Antiword - inkludert gjenoppretting av tekst som er endret i MS Word - sjekk ut manens siden (den er også online).