Hirdetés
- Luck Dragon: Asszociációs játék. :)
- sziku69: Fűzzük össze a szavakat :)
- Magga: PLEX: multimédia az egész lakásban
- D1Rect: Nagy "hülyétkapokazapróktól" topik
- Sub-ZeRo: Euro Truck Simulator 2 & American Truck Simulator 1 (esetleg 2 majd, ha lesz) :)
- sziku69: Szólánc.
- ldave: New Game Blitz - 2025
- Sundesz: 20 éve a PH!-n
- jakra: Retro gyujtemenyem (cloud synced for safety...)
- WireGuard VPN a mindennapokra
-
LOGOUT

Új hozzászólás Aktív témák
-
#05216000
törölt tag
válasz
ngabor2
#12353
üzenetére
Ha még kell segítség és itt nem kapsz, akkor küldj e-mailt a victorsugo@protonmail.com címre. Innen most kiszálltam.
(kinek volt az az idióta ötlete, hogy egy témához több hozzászólást nem lehet írni, míg valaki más nem ír? Ez valami hihetetlenül retardált megoldás, bármi is legyen az oka) -
#05216000
törölt tag
válasz
ngabor2
#12351
üzenetére
Azt hiszem, félreértesz. Az a baj, hogy a szinonima hivatkozása az eredetire nem konzisztens.
Bocs, csak példa, de nem tudom másképp:
Ha lenne egy "Dendrobium Orchidea" nevű növényed, aminek van ezer szinonimája, de a szinonimák hivatkozásaiban hol "Dendrobium Orchidea" van, hol "Dend. Orcihd.", máskor meg "Dendrobium O." akkor automatikusan, a mi eszközeinkkel, ezt nem lehet összepárosítani.
És eredetiként csak az egyik verzió szerepel.Normál körülmények közt csak annyi lenne a feladvány, hogy kiválogatod a neveket, amikre később szinonimák is vannak, majd a szinonima - eredeti párosokat kettéválasztani, field separator "-", kiírod fordított sorrendben, sorba rendezed és talán erre kell egy kis program, ami json-ra konvertálja az egészet.
cat *.htm | gawk 'BEGIN { FS="-" } /<P>~/{ a=$1; b=$2; sub("<P>~[ ]*","",a); sub("^[ ]*See[ ]*","",b); print b,"\t",a}'| sortEz kilistázza a szinonima - eredeti párokat úgy, hogy előre veszi az eredetit, mögé TAB karakterrel elválasztva a szinonimát. A /<P>~/ helyére kellene egy pontos minta a szinonimákat tartalmazó sorokhoz, amit nem sikerült megtalálnom, mert valami mindig kimaradt vagy épp olyan sorokat is felszedett, amik nem feleltek meg a követelményeknek.
Ennek a sort előtti kimenetét kellene összefésülni az eredetiket tartalmazó listákkal és összefűzni az azonos növényhez tartozó sorokat, majd az egészből json-t készíteni.
De nálam ez teli van szeméttel. -
#05216000
törölt tag
válasz
ngabor2
#12348
üzenetére
Keress rá erre: "Ascocentrum ampullaceum"
Nekem úgy tűnik, kénytelen leszel minden frissítésnél újra és újra átbogarászni a letöltött adatok tartalmát, mert csak ennél minimum kétféle elnevezést találtam, látszólag ugyanahhoz a növényhez. Kétféle alatt azt értem, hogy az egyik verzióban teljesen ki van írva a Lindley, a másikban Lindl. szerepel. És ilyenekből van bőven. Ahogy olyanból is, hogy <P>~ karakterekkel indul a sor, de mögötte nem elnevezés van, hanem egy <a href...> tag és csak az.Vagy az ilyen eltérések, hiányosságok még beleférnek?
Meg az is eszembe jutott, hogy ez legális egyáltalán? Úgy értem: szerzői jogokat nem sért ez a feldolgozás?
-
#05216000
törölt tag
válasz
ngabor2
#12346
üzenetére
Néhányszor nekifutottam, de olyan gányolmány az egész oldal, hogy ennek a feldolgozásához jó érzésű ember nem ír programot.

Mást ne mondjak: címlap lejön valami win-12xx kódolással, az aloldalak meg iso-8859-1-nek mondják magukat. (a címlapról úgy látom, lemaradt az encoding a fejlécből)Szóval erre programot írni szerintem nem sok értelme van. Amit én tennék, megpróbálnám manuálisan, szövegfeldolgozó programok segítségével kibányászni a szükséges infókat és abból előállítani a szükséges json formátumot. Túl sok programozással nem jár, a regex használat elég lehet a többséghez.
Az elindulásban tudok segíteni, ha gondolod.
-
-
Új hozzászólás Aktív témák
● olvasd el a téma összefoglalót!
- Bontatlan! Új Lenovo Thinkpad T14 G5 Tartós Üzleti Laptop 14" -45% Ultra 7 165U 16/512 FHD+ Magyar!
- Bomba Ár! Fujitsu LifeBook E751 - i5-2GEN I 4GB I 500GB I DVDRW I 15,6" HD I Cam I W10 I Gari!
- Bomba ár! Dell Latitude E6440 - i5-4GEN I 8GB I 256SSD I 14" HD I HDMI I Cam I W10 I Garancia!
- Bomba ár! Dell Latitude E6540 - i5-4GEN I 8GB I 500GB I HDMI I 15,6" HD I Cam I W10 I Garancia!
- Bomba Ár! Lenovo ThinkPad E15 G4 AMD - Ryzen 5 5625U I 8GB I 256SSD I 15,6" FHD I HDMI I W11 I Gari
- Samsung Galaxy S25 Ultra Titanium Jetblack Titán dizájn, 120 Hz AMOLED, AI Pro kamera
- 170 - Lenovo Legion Pro 7 (16IRX9H) - Intel Core i9-14900HX, RTX 4090
- Xiaomi Redmi Note 14 Pro+ 5G 256GB, Kártyafüggetlen, 1 Év Garanciával
- HIBÁTLAN iPhone 13 256GB Red -1 ÉV GARANCIA - Kártyafüggetlen, MS3735, 100% Akkumulátor
- Bomba ár! HP ProBook 430 G5 - i3-7GEN I 4GB I 128GB SSD I HDMI I 13,3" FHD I Cam I W11 I Garancia!
Állásajánlatok
Cég: NetGo.hu Kft.
Város: Gödöllő
Cég: PCMENTOR SZERVIZ KFT.
Város: Budapest




