Keresés

Új hozzászólás Aktív témák

  • maestro87

    őstag

    Sziasztok!
    Google Apps Script-tel szeretnék HTML oldalakat elemezni (webáruházakból termék neveit, árait lekérni Google táblázatba), viszont nem találom rá a tökéletes megoldást. A probléma az, hogy a beépített XMLparser nem támogat minden oldalt.
    Ez a Google Script-ben írt cheerio-gasify meg jól működik, viszont nem megoldás, mert borzasztóan lassú a futási ideje (~10 mp/oldal).
    Szóval meglehetne valahogy oldani, hogy a html oldalt átadjam pl. a böngészőnek elemzésre? Vagy találtam pl. ezt a Scrapy-t, azt hiszem ez is erre való és open source, de fogalmam sincs hogy kellene használni, webprogramozásban analfabéta vagyok. :(((
    Esetleg ingyenes weboldalon lehetne futtatni valami hasonló kódot, vagy ez nem járható út? Mert vannak ilyen fizetős külsős megoldások, de azoknak az ingyenes részei korlátozottan használhatók.

    Másik kérdés, ugyanebben a témában. Van ez a kód:
    <div class="item">
    <div class="subitem">
    /*Other elements*/
    </div>
    <h1 style="display:inline; data-labelids="21"> <img class="image" src="https://something.png">
    Text1
    </h1>
    <span class="allProperty">
    <strong>Text2</strong>
    <strong>Text3</strong>
    </span>
    </div>

    Hogy tudom kiszedni ebből a Text1, Text2, Text3 szöveget "Text1-Text2-Text3" formátumban úgy, hogy akkor is működjön ha a Text2 és/vagy Text3 nem minden oldalon van jelen, illetve az img tag is egyik html oldalon van a másikon meg nincs.

    Eddig ezt használtam, de most már nem minden esetben működik az új img tag miatt.
    var url = location.href;
    var item = document.querySelector("item");
    var title = item.querySelector(".h1").firstChild.textContent;
    if(item.querySelectorAll("span.allProperty > strong")[0])
    title += " -" + item.querySelectorAll("span.allProperty > strong")[0].firstChild.textContent;
    if(item.querySelectorAll("span.allProperty > strong")[1])
    title += item.querySelectorAll("span.allProperty > strong")[1].firstChild.textContent;

    Böngésző eszköztárra kellene "javascript" könyvjelzőnek. :)
    Segítséget előre is köszönöm! :R

Új hozzászólás Aktív témák

Hirdetés