Edukiak
Datuak PDF fitxategi bateko kalkulu-orri batetik Microsoft Excel orri batera transferitzeko zeregina beti da "dibertigarria". Batez ere, FineReader bezalako errekonozimendu software garestirik ez baduzu edo horrelako zerbait. Zuzeneko kopiak normalean ez du ezer onik ekartzen, zeren. kopiatutako datuak fitxan itsatsi ondoren, ziurrenik zutabe batean "elkarrekin itsatsi" dira. Hortaz, orduan arreta handiz banandu beharko dira tresna baten bidez Testua zutabeka fitxatik Data (Datuak — Testua zutabeetara).
Eta, jakina, kopiatzea posible da testu-geruza bat dagoen PDF fitxategi horietan soilik, hau da, paperetik PDFra eskaneatu berri den dokumentu batekin, printzipioz honek ez du funtzionatuko.
Baina ez da hain tristea, benetan 🙂
Office 2013 edo 2016 baduzu, minutu pare batean, programa gehigarririk gabe, oso posible da datuak PDFtik Microsoft Excelera transferitzea. Eta Word eta Power Query-k horretan lagunduko digu.
Adibidez, har dezagun PDF txosten hau Europako Ekonomia Batzordearen webguneko testu, formula eta taula mordo batekin:
... eta saiatu Excel-en ateratzen, esan lehen taula:
Goazen!
1. urratsa. Ireki PDF Word-en
Zerbaitegatik, jende gutxik daki, baina 2013az geroztik Microsoft Word-ek PDF fitxategiak ireki eta ezagutzen ikasi du (baita eskaneatutakoak ere, hau da, testu-geruzarik gabe!). Modu guztiz estandarrean egiten da: ireki Word, egin klik Fitxategia - Ireki (Fitxategia — Ireki) eta zehaztu PDF formatua leihoaren beheko eskuineko izkinan dagoen goitibeherako zerrendan.
Ondoren, hautatu behar dugun PDF fitxategia eta egin klik Ireki (Irekia). Word-ek esaten digu dokumentu honetan OCR exekutatuko duela testura:
Ados gaude eta segundo gutxiren buruan gure PDFa dagoeneko editatzeko irekita ikusiko dugu Word-en:
Noski, diseinuak, estiloak, letra-tipoak, goiburuak eta oinak, etab. dokumentutik hegan egingo dute partzialki, baina hori ez da garrantzitsua guretzat: tauletako datuak soilik behar ditugu. Printzipioz, fase honetan, dagoeneko tentagarria da aitortutako dokumentutik taula Word-era kopiatzea eta Excel-en itsatsi. Batzuetan funtzionatzen du, baina maizago mota guztietako datuen distortsioak ekartzen ditu; adibidez, zenbakiak data bihur daitezke edo testu gera daitezke, gure kasuan bezala, zeren. PDFak bereizleak ez direnak erabiltzen ditu:
Beraz, ez ditzagun bazterrak moztu, dena apur bat konplikatuago baizik, baina zuzen.
2. urratsa: Gorde dokumentua web orri gisa
Ondoren jasotako datuak Excel-en kargatzeko (Power Query bidez), gure dokumentua Word-en web-orri formatuan gorde behar da; formatu hau, kasu honetan, Word eta Excel-en arteko izendatzaile komun moduko bat da.
Horretarako, joan menura Fitxategia - Gorde honela (Fitxategia — Gorde honela) edo sakatu tekla F12 teklatuan eta irekitzen den leihoan, hautatu fitxategi mota Web orria fitxategi bakarrean (Web orria — Fitxategi bakarra):
Gorde ondoren, mhtml luzapena duen fitxategi bat lortu beharko zenuke (Fitxategien luzapenak ikusten badituzu Explorer-en).
3. etapa. Fitxategia Excel-era kargatzea Power Query bidez
Sortutako MHTML fitxategia Excel-en ireki dezakezu zuzenean, baina gero, lehenik eta behin, PDFaren eduki guztiak aldi berean lortuko ditugu, testu eta alferrikako taula mordoa batera, eta, bigarrenik, datuak berriro galduko ditugu okerra dela eta. bereizleak. Hori dela eta, inportazioa Excel-era egingo dugu Power Query gehigarriaren bidez. Hau guztiz doako gehigarri bat da, zeinaren bidez datuak ia edozein iturritatik (fitxategiak, karpetak, datu-baseak, ERP sistemak) igo ditzakezu Excelera eta, ondoren, jasotako datuak ahalik eta modu guztietan eraldatu, nahi den forma emanez.
Excel 2010-2013 baduzu, Power Query deskargatu dezakezu Microsoft webgune ofizialetik - instalatu ondoren fitxa bat ikusiko duzu Power kontsulta. Excel 2016 edo berriagoa baduzu, ez duzu ezer deskargatu behar - funtzionalitate guztiak Excel-en lehenetsita daude dagoeneko eta fitxan dago. Data (Data) taldean Deskargatu eta Bihurtu (Lortu eta eraldatu).
Beraz, fitxara joango gara Data, edo fitxan Power kontsulta eta aukeratu talde bat Datuak lortzeko or Sortu kontsulta - Fitxategitik - XMLtik. XML fitxategiak ez ezik, ikusgai jartzeko, aldatu leihoaren beheko eskuineko izkinan dagoen goitibeherako zerrendako iragazkiak hona Fitxategi guztiak (Fitxategi guztiak) eta zehaztu gure MHTML fitxategia:
Kontuan izan inportazioa ez dela behar bezala amaituko, izan ere. Power Query-k XML espero du guregandik, baina benetan HTML formatua dugu. Hori dela eta, agertzen den hurrengo leihoan, Power Query-ri ulergaitza den fitxategian eskuineko botoiarekin klik egin eta bere formatua zehaztu beharko duzu:
Horren ondoren, fitxategia behar bezala ezagutuko da eta dituen taula guztien zerrenda ikusiko dugu:
Taulen edukia ikus dezakezu Datu zutabeko gelaxken atzealde zurian (ez Taula hitzean!) saguaren ezkerreko botoian klik eginez.
Nahi duzun taula definitzen denean, egin klik hitz berdean Taula - eta bere edukietan "erortzen" zara:
Bere edukia "orrazi" egiteko urrats erraz batzuk egitea geratzen da, hau da:
- ezabatu behar ez diren zutabeak (egin klik eskuineko botoiarekin zutabeen goiburuan - Kendu)
- ordezkatu puntuak komaz (hautatu zutabeak, egin klik eskuineko botoiarekin - Balioak ordezkatzea)
- kendu berdintasun zeinuak goiburuko (hautatu zutabeak, egin klik eskuineko botoiarekin - Balioak ordezkatzea)
- kendu goiko lerroa (Hasiera – Ezabatu lerroak – Ezabatu goiko lerroak)
- kendu lerro hutsak (Hasiera – Ezabatu lerroak – Ezabatu lerro hutsak)
- igo lehenengo errenkada taularen goiburura (Hasiera - Erabili lehen lerroa goiburu gisa)
- iragazi behar ez diren datuak iragazkia erabiliz
Mahaia bere forma arruntera eramaten denean, komandoarekin orrira deskargatu daiteke itxi eta deskargatu (Itxi eta kargatu) on Nagusia fitxa. Eta dagoeneko lan egin dezakegun edertasuna lortuko dugu:
- Power Query-rekin zutabe bat taula bihurtzea
- Testu itsaskorra zutabeetan zatitzea