Hirdetés
- sziku69: Szólánc.
- Parci: Milyen mosógépet vegyek?
- Luck Dragon: Asszociációs játék. :)
- sziku69: Fűzzük össze a szavakat :)
- gban: Ingyen kellene, de tegnapra
- D1Rect: Nagy "hülyétkapokazapróktól" topik
- Brogyi: CTEK akkumulátor töltő és másolatai
- gerner1
- Meggyi001: Áram nélkül....méltóság nélkül.....
- Hieronymus: Az igaz barátság kezdete
-
LOGOUT

Új hozzászólás Aktív témák
-
Domonkos
addikt
-
válasz
total90
#12618
üzenetére
Név Utca Házszám Irányítószám Város
Igazabol ahogy felettem is irtak, a nev meg az utca kb eselytelen, hacsak nem talalsz egy olyan adatbazist, amiben minden varos minden utcaja szerepel, de meg ugy se 100%, bar ugy mar szerintem egy laza 90%-os szures megoldhato lenne.
Amugy az en algo-m ugy nezne ki, hogy jobbrol balra indulunk, igy nezve elso szam utani karaktersor a varos.
Marad az, hogy Név Utca Házszám Irányítószám.
Most balrol jobbra haladva elso szam utani ertek a Házszám Irányítószám.
Iranyitoszam minden esetben 4 karakter, igy az konnyu.
Maradt a Nev es az Utca.
Nevnel a fentebb emlitett ket nev, egy szokoz kombora losz, az a valosag ~90%-at lefedi.
Marad az utca, mint adott.De a nev - utca parost mindenkeppen le kell ellenorizned biorobot modszerrel.
-
Zalanius
tag
válasz
total90
#12618
üzenetére
"Név Utca Házszám Irányítószám Város"
Az eredeti kérdésben is írtad: a probléma az elválasztó karakter, ami ugyanolyan szóköz, amilyenből kis túlzással tetszőleges mennyiség előfordulhat a név, utca, város esetében mezőn belül is. Exceles eszközökkel stabil megoldás erre aligha lesz, még makrókkal sem, legfeljebb egy valamilyen közelítés. Itt az adatmennyiség a kulcs: pár száz sorig egyszerűen nem éri meg bonyolult szabályrendszereket kódolgatni, a humán erőforrás előbb végez. Ha valami nagyságrendekkel nagyobb listáról van szó, értékes adatokkal, amiből ez a katyvasz áll rendelkezésre, akkor meg a teljes folyamat defektes úgy, ahogy van...
Klasszikus adattisztítós / feltáró feladatként úgy ugranék neki, hogy ha nemzetköziek is a címek, azért a vonatkozó országok városainak (talán) teljes listája beszerezhető, ezért az azonosítás könnyű, ugyanígy az irányítószámok szerkezetére vonatkozó helyi szabályok. Utóbbi nyilván számokat is tartalmaz, ezért az utolsó ilyen töredék után már csak a városnevek lehetnek, a házszám szintén kell, hogy számokat tartalmazzon stb. Nyilván a név-utca felbontás a legtrükkösebb, pl. "Horváth Péter Mátyás Király tér".
De nem feltétlen kell ágyúval lőni az ilyen szóközös verébre. Vegyél egy pár soros mintát, nézd meg a tipikus szerkezetet. Ha van valami többségi mintázat, akkor legyen az a fő szabály, és a többit meg nézd át egyenként. Példa: szóközök mentén felbontva (Excelben: szövegből oszlopok) tipikusan 2 mező a név, 2 az utca, 1 a házszám, 1 az irányítószám, 1 a város. Ha az adott sor 7 mező széles, kész vagyunk, minden más esetet meg ki kell szűrni és átnézni. Nyilván a neveknél a prefix, mint Mr., Dr., Özv. stb. a fő veszély, a házszámoknál a külön írt /a vagy 4. em. 15., de ezekre fel lehet készülni.
Új hozzászólás Aktív témák
● olvasd el a téma összefoglalót!
- Új, Gamer félgép - GIGABYTE B850 GAMING X WiFi + Ryzen 7 9800X3D + Corsair 2x16GB DDR5 6000MHz
- Újszerű MSI Thin 15 - 15.6"FHD 144Hz - i5 -13420H - 16GB - 512GB - Win11- RTX 3050 - 2+ év garancia
- Intel Core I9 14900KS - 24mag/32szál - Eladó!
- Apple TV 4K 2021 32 GB (A2169)
- Új, Gamer félgép - MSI PRO B850-P WiFi + Ryzen 7 7800X3D + Kingston FURY 2x8GB DDR5 5600MHz
- Bomba áron dobozos Hp Laptop! /AMD Ryzen 5-7520U/8 GB/256 SSD/FHD/Garancia
- Apple iPhone 12 64GB,Használt,Adatkabel,12 hónap garanciával
- Dell Optiplex 3050 SFF,i5-6500,8GB DDR4,256GB SSD, WIN11
- Sapphire Pulse RX 9070XT új, felbontott // Számla // Garabcia //
- Lenovo ThinkStation P300 Workstation,i5-4590,16GB DDR3,256GB SSD,2GB VGA,WIN11
Állásajánlatok
Cég: Laptopműhely Bt.
Város: Budapest


