- D1Rect: Nagy "hülyétkapokazapróktól" topik
- Ndruu: Segíts kereshetővé tenni a PH-s arcképeket!
- Luck Dragon: Asszociációs játék. :)
- sziku69: Fűzzük össze a szavakat :)
- sziku69: Szólánc.
- btz: Internet fejlesztés országosan!
- bambano: Bambanő háza tája
- LordAthis: Ismét egy "Idióta" A.I. Projekt, hogy meglovagolja az aktuális trendeket...
- f(x)=exp(x): A laposföld elmebaj: Vissza a jövőbe!
- gban: Ingyen kellene, de tegnapra
-
LOGOUT
Új hozzászólás Aktív témák
-
Zalanius
tag
válasz
total90 #12618 üzenetére
"Név Utca Házszám Irányítószám Város"
Az eredeti kérdésben is írtad: a probléma az elválasztó karakter, ami ugyanolyan szóköz, amilyenből kis túlzással tetszőleges mennyiség előfordulhat a név, utca, város esetében mezőn belül is. Exceles eszközökkel stabil megoldás erre aligha lesz, még makrókkal sem, legfeljebb egy valamilyen közelítés. Itt az adatmennyiség a kulcs: pár száz sorig egyszerűen nem éri meg bonyolult szabályrendszereket kódolgatni, a humán erőforrás előbb végez. Ha valami nagyságrendekkel nagyobb listáról van szó, értékes adatokkal, amiből ez a katyvasz áll rendelkezésre, akkor meg a teljes folyamat defektes úgy, ahogy van...
Klasszikus adattisztítós / feltáró feladatként úgy ugranék neki, hogy ha nemzetköziek is a címek, azért a vonatkozó országok városainak (talán) teljes listája beszerezhető, ezért az azonosítás könnyű, ugyanígy az irányítószámok szerkezetére vonatkozó helyi szabályok. Utóbbi nyilván számokat is tartalmaz, ezért az utolsó ilyen töredék után már csak a városnevek lehetnek, a házszám szintén kell, hogy számokat tartalmazzon stb. Nyilván a név-utca felbontás a legtrükkösebb, pl. "Horváth Péter Mátyás Király tér".
De nem feltétlen kell ágyúval lőni az ilyen szóközös verébre. Vegyél egy pár soros mintát, nézd meg a tipikus szerkezetet. Ha van valami többségi mintázat, akkor legyen az a fő szabály, és a többit meg nézd át egyenként. Példa: szóközök mentén felbontva (Excelben: szövegből oszlopok) tipikusan 2 mező a név, 2 az utca, 1 a házszám, 1 az irányítószám, 1 a város. Ha az adott sor 7 mező széles, kész vagyunk, minden más esetet meg ki kell szűrni és átnézni. Nyilván a neveknél a prefix, mint Mr., Dr., Özv. stb. a fő veszély, a házszámoknál a külön írt /a vagy 4. em. 15., de ezekre fel lehet készülni.
Új hozzászólás Aktív témák
Hirdetés
● olvasd el a téma összefoglalót!
- Nvidia GPU-k jövője - amit tudni vélünk
- Kerékpárosok, bringások ide!
- Gaming notebook topik
- D1Rect: Nagy "hülyétkapokazapróktól" topik
- Ndruu: Segíts kereshetővé tenni a PH-s arcképeket!
- World of Tanks - MMO
- Luck Dragon: Asszociációs játék. :)
- Akkor is nehéz dolga lesz az Intelnek, ha részesedést vásárol benne az USA
- Parfüm topik
- RC modell földön, vízen, levegőben
- További aktív témák...
- Kingston FURY 64GB KIT DDR4 3200MHz CL16 Beast Black
- PlayStation Portal 2026.12.03-ig gyári garanciával eladó!
- ASRock B560 Steel Legend + i5 11500 + ID-Cooling + 16 Gb Corsair Vengeance RGB Beszámitok!
- Samsung Galaxy A26 5G 128GB, Kártyafüggetlen, 1 Év Garanciával
- Apple iPhone 14 128GB, Kártyafüggetlen, 1 Év Garanciával
- StarTech Thunderbolt 3 TB3DKDPMAW - Dual-4K Dock
- Bomba ár! HP EliteBook 735 G6 - Ryzen PRO 5 I 8GB I 256GB SSD I 13,3" FHD I Cam I W10 I Gari!
- LG 48C4 - 48" OLED evo - 4K 144Hz - 0.1ms - NVIDIA G-Sync - FreeSync - HDMI 2.1 - A9 Gen7 CPU
- IKEA (HAVREHOJ) tablet tartó
- ÁRGARANCIA!Épített KomPhone Ryzen 7 7800X3D 32/64GB RAM RTX 5070 12GB GAMER PC termékbeszámítással
Állásajánlatok
Cég: FOTC
Város: Budapest