Hirdetés

Keresés

Új hozzászólás Aktív témák

  • #05216000

    törölt tag

    válasz dabadab #12358 üzenetére

    "Kérjük, hogy várj türelemmel, amíg valaki válaszol a hozzászólásodra, ne írj újabb hozzászólást! Köszönjük megértésedet!"

    Akkor ez mi?
    Szoftverhiba?

  • #05216000

    törölt tag

    válasz sztanozs #12356 üzenetére

    A kedvedért megszakítottam a törlést.
    Ha nem tudod, miről van szó, akkor gondolom, csak az újakra vonatkozó szabály: írok egy témába, akkor addig nem írhatok újra, míg valaki más hozzá nem szól. Akkor sem, ha napokkal ezelőtt írtam oda utoljára.
    Először arra gondoltam, hogy egyfajta spam védelem, de ha az, akkor egy rendkívül dilettáns megoldás ez így, timeout nélkül.

    Mielőtt még valaki megkérdezné: töröltem magam, majd visszanéztem, hogy a törlés után olvasható maradt-e az üzenetem, akkor láttam sztanozs kérdését. No. Akkor most újra vissza a wastebasketba :)

  • #05216000

    törölt tag

    válasz ngabor2 #12353 üzenetére

    Ha még kell segítség és itt nem kapsz, akkor küldj e-mailt a victorsugo@protonmail.com címre. Innen most kiszálltam.
    (kinek volt az az idióta ötlete, hogy egy témához több hozzászólást nem lehet írni, míg valaki más nem ír? Ez valami hihetetlenül retardált megoldás, bármi is legyen az oka)

  • #05216000

    törölt tag

    válasz ngabor2 #12351 üzenetére

    Azt hiszem, félreértesz. Az a baj, hogy a szinonima hivatkozása az eredetire nem konzisztens.

    Bocs, csak példa, de nem tudom másképp:
    Ha lenne egy "Dendrobium Orchidea" nevű növényed, aminek van ezer szinonimája, de a szinonimák hivatkozásaiban hol "Dendrobium Orchidea" van, hol "Dend. Orcihd.", máskor meg "Dendrobium O." akkor automatikusan, a mi eszközeinkkel, ezt nem lehet összepárosítani.
    És eredetiként csak az egyik verzió szerepel.

    Normál körülmények közt csak annyi lenne a feladvány, hogy kiválogatod a neveket, amikre később szinonimák is vannak, majd a szinonima - eredeti párosokat kettéválasztani, field separator "-", kiírod fordított sorrendben, sorba rendezed és talán erre kell egy kis program, ami json-ra konvertálja az egészet.

    cat *.htm | gawk 'BEGIN { FS="-" } /<P>~/{ a=$1; b=$2; sub("<P>~[ ]*","",a); sub("^[ ]*See[ ]*","",b); print b,"\t",a}'| sort

    Ez kilistázza a szinonima - eredeti párokat úgy, hogy előre veszi az eredetit, mögé TAB karakterrel elválasztva a szinonimát. A /<P>~/ helyére kellene egy pontos minta a szinonimákat tartalmazó sorokhoz, amit nem sikerült megtalálnom, mert valami mindig kimaradt vagy épp olyan sorokat is felszedett, amik nem feleltek meg a követelményeknek.
    Ennek a sort előtti kimenetét kellene összefésülni az eredetiket tartalmazó listákkal és összefűzni az azonos növényhez tartozó sorokat, majd az egészből json-t készíteni.
    De nálam ez teli van szeméttel.

  • #05216000

    törölt tag

    válasz ngabor2 #12348 üzenetére

    Keress rá erre: "Ascocentrum ampullaceum"
    Nekem úgy tűnik, kénytelen leszel minden frissítésnél újra és újra átbogarászni a letöltött adatok tartalmát, mert csak ennél minimum kétféle elnevezést találtam, látszólag ugyanahhoz a növényhez. Kétféle alatt azt értem, hogy az egyik verzióban teljesen ki van írva a Lindley, a másikban Lindl. szerepel. És ilyenekből van bőven. Ahogy olyanból is, hogy <P>~ karakterekkel indul a sor, de mögötte nem elnevezés van, hanem egy <a href...> tag és csak az.

    Vagy az ilyen eltérések, hiányosságok még beleférnek?

    Meg az is eszembe jutott, hogy ez legális egyáltalán? Úgy értem: szerzői jogokat nem sért ez a feldolgozás?

  • #05216000

    törölt tag

    válasz ngabor2 #12346 üzenetére

    Néhányszor nekifutottam, de olyan gányolmány az egész oldal, hogy ennek a feldolgozásához jó érzésű ember nem ír programot. :(
    Mást ne mondjak: címlap lejön valami win-12xx kódolással, az aloldalak meg iso-8859-1-nek mondják magukat. (a címlapról úgy látom, lemaradt az encoding a fejlécből)

    Szóval erre programot írni szerintem nem sok értelme van. Amit én tennék, megpróbálnám manuálisan, szövegfeldolgozó programok segítségével kibányászni a szükséges infókat és abból előállítani a szükséges json formátumot. Túl sok programozással nem jár, a regex használat elég lehet a többséghez.

    Az elindulásban tudok segíteni, ha gondolod.

  • #05216000

    törölt tag

    válasz dabadab #12338 üzenetére

    Szia! Bocs, kicsit késve reagálok, igazából töröltem is még aznap a regisztrációmat, mert azt hittem, megvan a megoldás.
    Kissé pongyolán fogalmaztam: én mostanában pythonnal foglalkozom, de tudtommal más nyelveken sem csak a fork érhető el, ha subprocesszt akarok létrehozni.
    Pythonnak ugye van az os.fork(), a process.Process és még sokan mások.
    No ez utóbbiakra gondoltam, amikor azt írtam, hogy nem forkolt.
    De ugye amit te írsz, az inkább csak kötekedés kategóriába sorolható, mivel a legtöbb esetben a fork() után a gyerek processzben rögtön végrehajtódik egy exec() (valamely variációja) és nem nagyon kell foglalkozni azokkal a dolgokkal, amikkel akkor kell, ha az eredeti programod fut tovább mindkét processzben. Gondolok itt például a fork előtt megnyitott fájlokra.

    A 2. pont lett volna fontosabb, de közben rájöttem, hogy a json stringet gyárt, kell neki egy encode/decode a socketen átküldés előtt/után, szóval ez a rész megoldódott.

  • #05216000

    törölt tag

    Sziasztok! Példaprogramot keresek, ami segít eligazodni a socket programozás világában.
    Jó lenne, ha Python3-ban íródott volna, de jöhet C, PHP, Ruby, esetleg Java is.
    Ami fontos, hogy valódi, működő, használható, de viszonylag kicsi legyen a kód.
    A valódi alatt azt értem, hogy köszönöm, az echo client/server kódokkal teli a net, nekem valami olyanra lenne szükségem, ami segít eligazodni abban, hogy saját "protokollt" hogyan lehet megvalósítani, ráadásul több szálon.

    Amit szeretnék belőle megérteni, mert az eddigi tutorialok alapján nem igazán sikerült:
    1. Párhuzamosan több kérést hogyan szokás, elsősorban unix/linux rendszeren feldolgozni? A fork()-os példákkal az a gondom, hogy egyrészt a fork() elég sok megkötést hoz magával, másrészt nem látom igazán előnyét az olyan multiprocess/multithread-es alkalmazásokkal szemben, ahol önálló, nem forkolt processzt/szálat indítok, viszont hátrányt látok néhányat. Például a nyitva felejtett filedescriptor-ok párhuzamos használata, ami elég csúnya hibákhoz vezet.

    2. A socketen folyó kommunikációra is jó lenne használható példát látni, lehetőleg ugyanott és ezért lenne előny a Python forrás. Ugyanis a send/receive python-ban byte-okat küld, nem stringet (eltérő típus, nem úgy, mint C-ben). Emiatt kell valami, ami képes biztonságosan visszakonvertálni a bájtokat az eredeti formájukra. Eddig csak egy pickle nevű modult találtam e célra, aminek már a leírása is tartalmazza, hogy csak biztonságos forrásból származó byte sorozat deszerializálására alkalmas. Ha nem megbízható a forrás, például internetes klienstől jön valami, akkor felejtsük el. De nem adtak javaslatot, hogy akkor mit kellene helyette.

    Szóval ilyesmire kellene valami élesben működő opensource szoftver forrása, ami szerintetek elfogadható szintet képvisel.

Új hozzászólás Aktív témák