Inportatu datuak PDFtik Excelera Power Query bidez

Datuak PDF fitxategi bateko kalkulu-orri batetik Microsoft Excel orri batera transferitzeko zeregina beti da "dibertigarria". Batez ere, FineReader bezalako errekonozimendu software garestirik ez baduzu edo horrelako zerbait. Zuzeneko kopiak normalean ez du ezer onik ekartzen, zeren. kopiatutako datuak fitxan itsatsi ondoren, ziurrenik zutabe batean "elkarrekin itsatsi" dira. Hortaz, orduan arreta handiz banandu beharko dira tresna baten bidez Testua zutabeka fitxatik Data (Datuak — Testua zutabeetara).

Eta, jakina, kopiatzea posible da testu-geruza bat dagoen PDF fitxategi horietan soilik, hau da, paperetik PDFra eskaneatu berri den dokumentu batekin, printzipioz honek ez du funtzionatuko.

Baina ez da hain tristea, benetan 🙂

Office 2013 edo 2016 baduzu, minutu pare batean, programa gehigarririk gabe, oso posible da datuak PDFtik Microsoft Excelera transferitzea. Eta Word eta Power Query-k horretan lagunduko digu.

Adibidez, har dezagun PDF txosten hau Europako Ekonomia Batzordearen webguneko testu, formula eta taula mordo batekin:

Inportatu datuak PDFtik Excelera Power Query bidez

... eta saiatu Excel-en ateratzen, esan lehen taula:

Inportatu datuak PDFtik Excelera Power Query bidez

Goazen!

1. urratsa. Ireki PDF Word-en

Zerbaitegatik, jende gutxik daki, baina 2013az geroztik Microsoft Word-ek PDF fitxategiak ireki eta ezagutzen ikasi du (baita eskaneatutakoak ere, hau da, testu-geruzarik gabe!). Modu guztiz estandarrean egiten da: ireki Word, egin klik Fitxategia - Ireki (Fitxategia — Ireki) eta zehaztu PDF formatua leihoaren beheko eskuineko izkinan dagoen goitibeherako zerrendan.

Ondoren, hautatu behar dugun PDF fitxategia eta egin klik Ireki (Irekia). Word-ek esaten digu dokumentu honetan OCR exekutatuko duela testura:

Inportatu datuak PDFtik Excelera Power Query bidez

Ados gaude eta segundo gutxiren buruan gure PDFa dagoeneko editatzeko irekita ikusiko dugu Word-en:

Inportatu datuak PDFtik Excelera Power Query bidez

Noski, diseinuak, estiloak, letra-tipoak, goiburuak eta oinak, etab. dokumentutik hegan egingo dute partzialki, baina hori ez da garrantzitsua guretzat: tauletako datuak soilik behar ditugu. Printzipioz, fase honetan, dagoeneko tentagarria da aitortutako dokumentutik taula Word-era kopiatzea eta Excel-en itsatsi. Batzuetan funtzionatzen du, baina maizago mota guztietako datuen distortsioak ekartzen ditu; adibidez, zenbakiak data bihur daitezke edo testu gera daitezke, gure kasuan bezala, zeren. PDFak bereizleak ez direnak erabiltzen ditu:

Inportatu datuak PDFtik Excelera Power Query bidez

Beraz, ez ditzagun bazterrak moztu, dena apur bat konplikatuago baizik, baina zuzen.

2. urratsa: Gorde dokumentua web orri gisa

Ondoren jasotako datuak Excel-en kargatzeko (Power Query bidez), gure dokumentua Word-en web-orri formatuan gorde behar da; formatu hau, kasu honetan, Word eta Excel-en arteko izendatzaile komun moduko bat da.

Horretarako, joan menura Fitxategia - Gorde honela (Fitxategia — Gorde honela) edo sakatu tekla F12 teklatuan eta irekitzen den leihoan, hautatu fitxategi mota Web orria fitxategi bakarrean (Web orria — Fitxategi bakarra):

Inportatu datuak PDFtik Excelera Power Query bidez

Gorde ondoren, mhtml luzapena duen fitxategi bat lortu beharko zenuke (Fitxategien luzapenak ikusten badituzu Explorer-en).

3. etapa. Fitxategia Excel-era kargatzea Power Query bidez

Sortutako MHTML fitxategia Excel-en ireki dezakezu zuzenean, baina gero, lehenik eta behin, PDFaren eduki guztiak aldi berean lortuko ditugu, testu eta alferrikako taula mordoa batera, eta, bigarrenik, datuak berriro galduko ditugu okerra dela eta. bereizleak. Hori dela eta, inportazioa Excel-era egingo dugu Power Query gehigarriaren bidez. Hau guztiz doako gehigarri bat da, zeinaren bidez datuak ia edozein iturritatik (fitxategiak, karpetak, datu-baseak, ERP sistemak) igo ditzakezu Excelera eta, ondoren, jasotako datuak ahalik eta modu guztietan eraldatu, nahi den forma emanez.

Excel 2010-2013 baduzu, Power Query deskargatu dezakezu Microsoft webgune ofizialetik - instalatu ondoren fitxa bat ikusiko duzu Power kontsulta. Excel 2016 edo berriagoa baduzu, ez duzu ezer deskargatu behar - funtzionalitate guztiak Excel-en lehenetsita daude dagoeneko eta fitxan dago. Data (Data) taldean Deskargatu eta Bihurtu (Lortu eta eraldatu).

Beraz, fitxara joango gara Data, edo fitxan Power kontsulta eta aukeratu talde bat Datuak lortzeko or Sortu kontsulta - Fitxategitik - XMLtik. XML fitxategiak ez ezik, ikusgai jartzeko, aldatu leihoaren beheko eskuineko izkinan dagoen goitibeherako zerrendako iragazkiak hona Fitxategi guztiak (Fitxategi guztiak) eta zehaztu gure MHTML fitxategia:

Inportatu datuak PDFtik Excelera Power Query bidez

Kontuan izan inportazioa ez dela behar bezala amaituko, izan ere. Power Query-k XML espero du guregandik, baina benetan HTML formatua dugu. Hori dela eta, agertzen den hurrengo leihoan, Power Query-ri ulergaitza den fitxategian eskuineko botoiarekin klik egin eta bere formatua zehaztu beharko duzu:

Inportatu datuak PDFtik Excelera Power Query bidez

Horren ondoren, fitxategia behar bezala ezagutuko da eta dituen taula guztien zerrenda ikusiko dugu:

Inportatu datuak PDFtik Excelera Power Query bidez

Taulen edukia ikus dezakezu Datu zutabeko gelaxken atzealde zurian (ez Taula hitzean!) saguaren ezkerreko botoian klik eginez.

Nahi duzun taula definitzen denean, egin klik hitz berdean Taula - eta bere edukietan "erortzen" zara:

Inportatu datuak PDFtik Excelera Power Query bidez

Bere edukia "orrazi" egiteko urrats erraz batzuk egitea geratzen da, hau da:

  1. ezabatu behar ez diren zutabeak (egin klik eskuineko botoiarekin zutabeen goiburuan - Kendu)
  2. ordezkatu puntuak komaz (hautatu zutabeak, egin klik eskuineko botoiarekin - Balioak ordezkatzea)
  3. kendu berdintasun zeinuak goiburuko (hautatu zutabeak, egin klik eskuineko botoiarekin - Balioak ordezkatzea)
  4. kendu goiko lerroa (Hasiera – Ezabatu lerroak – Ezabatu goiko lerroak)
  5. kendu lerro hutsak (Hasiera – Ezabatu lerroak – Ezabatu lerro hutsak)
  6. igo lehenengo errenkada taularen goiburura (Hasiera - Erabili lehen lerroa goiburu gisa)
  7. iragazi behar ez diren datuak iragazkia erabiliz

Mahaia bere forma arruntera eramaten denean, komandoarekin orrira deskargatu daiteke itxi eta deskargatu (Itxi eta kargatu) on Nagusia fitxa. Eta dagoeneko lan egin dezakegun edertasuna lortuko dugu:

Inportatu datuak PDFtik Excelera Power Query bidez

  • Power Query-rekin zutabe bat taula bihurtzea
  • Testu itsaskorra zutabeetan zatitzea

Utzi erantzun bat