Eemalda Exceli andmete dublikaat

01 02

Duplicate Data Recordsi eemaldamine Excelis

Eemalda duplikaadid - Identsete kirjade otsimine nime järgi. © Ted French

Arvutustabeli programme, näiteks Exceli, kasutatakse tihti andmebaasina selliste asjade jaoks nagu varuosade, müügiarvestuste ja meililistide jaoks.

Exceli andmebaasid koosnevad andmetest tabelitest, mis on tavapäraselt jagatud andmete nimega rekordidesse.

Rekordis on iga rea ​​lahtri või välja andmed seotud - näiteks ettevõtte nime, aadressi ja telefoninumbri.

Andmebaasis suureneb ühine probleem, mis on dubleerivate andmete või andmete rida.

Selline dubleerimine võib tekkida, kui:

Mõlemal juhul võivad eksemplaris sisalduvad dokumendid põhjustada terve rida probleeme - näiteks selliste dokumentide saatmine samale isikule mitme koopiaga, kui andmebaasi teavet kasutatakse kirjavahetuses - nii on hea mõte korrapäraselt kontrollida ja eemaldada dubleeritud dokumente alus.

Kuigi väikestes näidetes, nagu ülaltoodud pildil, on lihtne koguda topeltarvestusi, võib andmetabelid hõlpsasti sisaldada sadu, kui mitte tuhandeid dokumente, mistõttu on dubleeritavate dokumentide väljavalimine väga keeruline - eriti osaliselt samaväärsed dokumendid.

Selle ülesande täitmiseks on Excelil sisseehitatud andmetööriist, mida ei kutsuta üllatuslikult eemaldama duplikaate , mida saab kasutada identsete ja osaliselt vastavate andmete leidmiseks ja eemaldamiseks.

Kuid nii, nagu Eemalda dubleeriv tööriist on projekteeritud, identsed ja osaliselt sobivad, tuleb käsitleda eraldi.

Seda seetõttu, et dialoogiboks Eemalda duplikaadid näitab välja valitud andmetabelile väljade nimed ja valite, millised väljad lisatakse vastavate andmete otsimiseks.

Välja nimed vs veergud

Nagu mainitud, tööriist Eemalda duplikaadid koosneb dialoogist, kus saate valida soovitud väli või veeru nimesid välja lülitades vastavate väljade otsimiseks.

Dialoogiboksis olev teave - väliinimesid või veerupärasid - sõltub sellest, kas teie andmed sisaldavad rida päiseid või päiseid andmevaba laua ülaosas, nagu eespool näidatud pildil.

Kui see toimub - veenduge, et dialoogiboksi paremal küljel asuv valik - Minu andmed on päised - on märgitud ja Excel näitab selle rea nimesid nimeväljadena dialoogiboksis.

Kui teie andmetel pole päiserea, kuvatakse dialoogiboksis valitud andmevahemiku dialoogiboksis sobivad veerud .

Järgnevad andmevahemikud

Eemaldatavate dublikaatide tööriista korralikuks töötamiseks peab andmeväljade andmeväljade vahetus olema lähedane - see ei tohi sisaldada tühje ridu, veerge ega võimaluse korral ühtegi tühja lahtris asuvat lahtrit .

Andmeloa tabelis olevate tühikute puudumine on hea tava andmete haldamiseks üldiselt, mitte ainult andmete dubleerimise otsimisel. Exceli muud andmetööriistad - näiteks sorteerimine ja filtreerimine - toimivad kõige paremini, kui andmetabel on andmete hulk.

Duplicate Data Recordsi näide eemaldamine

Ülaltoodud pildil on andmeväljal kaks A. Thompsoni samaväärset kirjet ja R. Holti kaks osaliselt sobivat kirjet, kus kõik väljad vastavad, välja arvatud õpilaste arv.

Allpool loetletud sammud kirjeldavad, kuidas kasutada Eemalda kordusandmete tööriista järgmiselt:

  1. Eemaldage A. Thompsoni teine ​​identne dokument.
  2. Eemaldage R. Holti teine ​​osaliselt sobiv register.

Dialoogiakna Eemalda kordusavade avamine

  1. Klõpsake loendis andmebaasis olevate andmetega raamistikul.
  2. Klõpsake lindil vahekaarti Andmed .
  3. Klõpsake ikooni Eemalda dublikaadid, et tõsta esile kõik andmetabelites olevad andmed ja avada dialoogiboks Eemalda dublikaadid .
  4. Dialoogiboks Eemalda duplikaadid kuvab kõik meie andmeproovist veeru pealkirjad või väljade nimed
  5. Väljade nimede kõrval olevad märgised näitavad, milliseid veerge Excel proovib dubleerivate dokumentide otsimisel sobitada
  6. Vaikimisi avaneb dialoogiboks, kui kõik välja nimed on välja lülitatud

Identsete dokumentide leidmine

  1. Kuna me otsime täiesti identseid dokumente selles näites, jätame kõik veeru pealkirjad kontrollitud
  2. Klõpsake nuppu OK

Siinkohal tuleks näha järgmisi tulemusi:

02 02

Leidke ja eemaldage osaliselt sobivad registrid ja eemaldage duplikaadid

Eemaldage duplikaadid - osaliselt sobivate kirjade otsimine vastavalt väljadel nimele. © Ted French

Üks väli ühe korra kontrollimine

Kuna Exceli eemaldab ainult andmepaketid, mis täpselt vastavad valitud andmeväljadele, on parim viis kõigi osaliselt sobivate andmefailide leidmiseks eemaldada ainult üks välimus korraga, nagu tehakse allpool toodud juhiste kohaselt.

Järgnevates otsingutes, mis sobivad kõikides väljades, välja arvatud nimi, vanus või programm, eemaldatakse kõik võimalikud kombinatsioonid osaliselt sobivate dokumentide jaoks.

Osaliselt sobivate kirjade leidmine

  1. Klõpsake vajadusel andmete tabelis olevaid andmeid sisaldavate lahtrite korral
  2. Klõpsake lindil vahekaarti Andmed .
  3. Klõpsake ikooni Eemalda dublikaadid, et tõsta esile kõik andmetabelites olevad andmed ja avada dialoogiboks Eemalda dublikaadid .
  4. Kõik andmevälja lahtrid või veeruloendid on valitud.
  5. Et leida ja eemaldada dokumente, mis ei vasta igas valdkonnas, eemaldage kontrollmärk lisaks nende väljadest, mida Exceli ignoreerib.
  6. Selle näite jaoks klõpsake märkeruutu kõrval oleval veergu Student ID, et eemaldada kontrollmärk.
  7. Exceli abil saate otsida ja eemaldada ainult dokumente, millel on vastavad andmed väljade " Perekonnanimi" , " Algne " ja " Program" .
  8. Klõpsake nuppu OK
  9. Dialoogiboks peaks sulgema ja asendada sõnumiga, mis ütleb: 1 korduvat väärtust on leitud ja eemaldatud; 6 unikaalset väärtust jääb.
  10. Rida, mis sisaldab R. Holti teist kirje ST348-252 õpilase ID-st, on andmebaasist eemaldatud.
  11. Sõnumikasti sulgemiseks klõpsake OK

Siinkohal ei tohiks näidisandmete tabel sisaldada kõiki dubleerivaid andmeid.