<?xml version="1.0" encoding="UTF-8" ?>
<rss
    version="2.0"
    xmlns:atom="http://www.w3.org/2005/Atom"
    xmlns:content="http://purl.org/rss/1.0/modules/content/"
    xmlns:webfeeds="http://webfeeds.org/rss/1.0"
    xmlns:media="http://search.yahoo.com/mrss/"
    >
    <channel>
        <title>Scraping Tag - Viblo</title>
        <link>https://viblo.asia/rss</link>
        <description><![CDATA[Free service for technical knowledge sharing]]></description>
        <atom:link href="https://viblo.asia/rss/tags/scraping.rss" rel="self"></atom:link>
                <copyright>Sun* Inc.</copyright>
                                                <webfeeds:logo>https://viblo.asia/logo_full.svg</webfeeds:logo>
        <image>
            <url>https://viblo.asia/logo_full.svg</url>
            <title>Scraping Tag - Viblo</title>
            <link>https://viblo.asia/rss</link>
        </image>
                                <language>vi-vn</language>
        <lastBuildDate>2026-06-19T19:19:34+07:00</lastBuildDate>
                <item>
            <title><![CDATA[[Open Source] #163 - NeoDB: Hệ thống quản trị tri thức văn hóa phi tập trung với Django, ActivityPub và kiến trúc Metadata Mapping đa tầng]]></title>
                        <link>https://viblo.asia/p/open-source-163-neodb-he-thong-quan-tri-tri-thuc-van-hoa-phi-tap-trung-voi-django-activitypub-va-kien-truc-metadata-mapping-da-tang-wd43EZZQLX9</link>
            <guid isPermaLink="true">https://viblo.asia/p/open-source-163-neodb-he-thong-quan-tri-tri-thuc-van-hoa-phi-tap-trung-voi-django-activitypub-va-kien-truc-metadata-mapping-da-tang-wd43EZZQLX9</guid>
            <description><![CDATA[Trong hệ sinh thái nội dung số, việc sở hữu dữ liệu cá nhân về các sản phẩm văn hóa (sách, phim, nhạc, game) thường bị giới hạn trong các "khu vườn đó...]]></description>
                        <dc:creator xmlns:dc="http://purl.org/dc/elements/1.1/">Trung tín Phạm</dc:creator>
            <pubDate>2026-04-20 15:33:37</pubDate>
                                                                                                        </item>
                <item>
            <title><![CDATA[Hướng dẫn Crawl Data: Kinh nghiệm thực tế từ Tripadvisor]]></title>
                        <link>https://viblo.asia/p/huong-dan-crawl-data-kinh-nghiem-thuc-te-tu-tripadvisor-vbLbjjqoLnk</link>
            <guid isPermaLink="true">https://viblo.asia/p/huong-dan-crawl-data-kinh-nghiem-thuc-te-tu-tripadvisor-vbLbjjqoLnk</guid>
            <description><![CDATA[Crawl data là một kỹ năng quan trọng trong xử lý dữ liệu web. Trong bài viết này, tôi sẽ chia sẻ về cơ bản crawl data, sự khác nhau giữa SSR và CSR, c...]]></description>
                        <dc:creator xmlns:dc="http://purl.org/dc/elements/1.1/">Pham Huy Hoang</dc:creator>
            <pubDate>2025-11-21 00:31:15</pubDate>
                                                                                                        </item>
                <item>
            <title><![CDATA[[Ruby] Crawl Data và Scrape Data]]></title>
                        <link>https://viblo.asia/p/ruby-crawl-data-va-scrape-data-yZjJY9RbJOE</link>
            <guid isPermaLink="true">https://viblo.asia/p/ruby-crawl-data-va-scrape-data-yZjJY9RbJOE</guid>
            <description><![CDATA[Hi 
Trong lĩnh vực thu thập dữ liệu trên web, hai thuật ngữ phổ biến là "scraping" và "crawling". Cả hai đều là các phương pháp để lấy dữ liệu từ các ...]]></description>
                        <dc:creator xmlns:dc="http://purl.org/dc/elements/1.1/">Ngô Quý ườ</dc:creator>
            <pubDate>2023-07-11 15:47:28</pubDate>
                                                                                                        </item>
                <item>
            <title><![CDATA[Một số kỹ thuật tăng tốc Puppeteer khi scraping]]></title>
                        <link>https://viblo.asia/p/mot-so-ky-thuat-tang-toc-puppeteer-khi-scraping-1Je5E680KnL</link>
            <guid isPermaLink="true">https://viblo.asia/p/mot-so-ky-thuat-tang-toc-puppeteer-khi-scraping-1Je5E680KnL</guid>
            <description><![CDATA[Puppeteer là thư viện phổ biến được sử dụng để scraping, chắc mọi người đã khá quen thuộc với việc sử dụng nó. Hôm nay mình sẽ trình bày 1 vài tip để ...]]></description>
                        <dc:creator xmlns:dc="http://purl.org/dc/elements/1.1/">Dat Bui</dc:creator>
            <pubDate>2021-08-18 16:13:47</pubDate>
                                                                                                        </item>
                <item>
            <title><![CDATA[Job Board Scraping với Rails]]></title>
                        <link>https://viblo.asia/p/job-board-scraping-voi-rails-gAm5yDJAldb</link>
            <guid isPermaLink="true">https://viblo.asia/p/job-board-scraping-voi-rails-gAm5yDJAldb</guid>
            <description><![CDATA[Dữ liệu liên quan đến công việc(jobs) là một trong những dữ liệu yêu thích của nhiều người.
Mặc dù có một số public database tuyệt vời với thông tin l...]]></description>
                        <dc:creator xmlns:dc="http://purl.org/dc/elements/1.1/">Thai Quoc Vuong</dc:creator>
            <pubDate>2020-08-14 21:45:08</pubDate>
                                                                                                        </item>
                <item>
            <title><![CDATA[Giới thiệu/hướng dẫn về Crawler với Scrapy Framework (Phần 2)]]></title>
                        <category>Development</category>
                        <link>https://viblo.asia/p/gioi-thieuhuong-dan-ve-crawler-voi-scrapy-framework-phan-2-YWOZry7pKQ0</link>
            <guid isPermaLink="true">https://viblo.asia/p/gioi-thieuhuong-dan-ve-crawler-voi-scrapy-framework-phan-2-YWOZry7pKQ0</guid>
            <description><![CDATA[Ở phần trước mình đã giới thiệu với các bạn về thành phần và luồng hoạt động của Scrapy Framwork, tới phần này mình sẽ hướng dẫn các bạn cài đặt và sử...]]></description>
                        <dc:creator xmlns:dc="http://purl.org/dc/elements/1.1/">Lê Quý Quyết</dc:creator>
            <pubDate>2017-11-01 00:11:41</pubDate>
                                                                                                        </item>
                <item>
            <title><![CDATA[Scrape websites with Ruby &amp; Mechanize]]></title>
                        <link>https://viblo.asia/p/scrape-websites-with-ruby-mechanize-DzVkpmoKvnW</link>
            <guid isPermaLink="true">https://viblo.asia/p/scrape-websites-with-ruby-mechanize-DzVkpmoKvnW</guid>
            <description><![CDATA[Introduction

Web scraping là một cách để trích xuất dữ liệu từ những website mà không có API. Phương pháp này đôi lúc sẽ hoạt động không chính xác do...]]></description>
                        <dc:creator xmlns:dc="http://purl.org/dc/elements/1.1/">Nguyễn Lực</dc:creator>
            <pubDate>2016-12-27 17:38:18</pubDate>
                                                                                                        </item>
                <item>
            <title><![CDATA[PyMOTM: Beautiful Soup 4 (Part III)]]></title>
                        <link>https://viblo.asia/p/pymotm-beautiful-soup-4-part-iii-XqaGEBJEeWK</link>
            <guid isPermaLink="true">https://viblo.asia/p/pymotm-beautiful-soup-4-part-iii-XqaGEBJEeWK</guid>
            <description><![CDATA[Beautiful Soup 4

Mục đích: Parse HTML, XML và Website scraping

Chúng ta tiếp tục sang phần III của series PyMOTM: Beautiful Soup 4 nhé. Như Phần II ...]]></description>
                        <dc:creator xmlns:dc="http://purl.org/dc/elements/1.1/">NamNV609</dc:creator>
            <pubDate>2016-07-25 15:46:09</pubDate>
                                                                                                        </item>
                <item>
            <title><![CDATA[PyMOTM: Beautiful Soup 4 (Part II)]]></title>
                        <link>https://viblo.asia/p/pymotm-beautiful-soup-4-part-ii-amoG81yOvz8P</link>
            <guid isPermaLink="true">https://viblo.asia/p/pymotm-beautiful-soup-4-part-ii-amoG81yOvz8P</guid>
            <description><![CDATA[Beautiful Soup 4

Mục đích: Parse HTML, XML và Website scraping

Hôm nay chúng ta tiếp tục phần II của module Beautiful Soup 4 của Python trong series...]]></description>
                        <dc:creator xmlns:dc="http://purl.org/dc/elements/1.1/">NamNV609</dc:creator>
            <pubDate>2016-06-26 07:16:15</pubDate>
                                                                                                        </item>
                <item>
            <title><![CDATA[PyMOTM: Beautiful Soup 4 (Part I)]]></title>
                        <link>https://viblo.asia/p/pymotm-beautiful-soup-4-part-i-DljMbVZZMVZn</link>
            <guid isPermaLink="true">https://viblo.asia/p/pymotm-beautiful-soup-4-part-i-DljMbVZZMVZn</guid>
            <description><![CDATA[Beautiful Soup 4

Mục đích: Parse HTML, XML và Website scraping

Bạn muốn parse HTML, XML hay đơn giản là muốn scraping dữ liệu từ một website nào đó ...]]></description>
                        <dc:creator xmlns:dc="http://purl.org/dc/elements/1.1/">NamNV609</dc:creator>
            <pubDate>2016-05-27 20:02:52</pubDate>
                                                                                                        </item>
                <item>
            <title><![CDATA[Kỹ thuật scraping và crawling Web nâng cao với Scrapy và SQLAlchemy]]></title>
                        <category>Development</category>
                        <link>https://viblo.asia/p/ky-thuat-scraping-va-crawling-web-nang-cao-voi-scrapy-va-sqlalchemy-6BkGyxzeM5aV</link>
            <guid isPermaLink="true">https://viblo.asia/p/ky-thuat-scraping-va-crawling-web-nang-cao-voi-scrapy-va-sqlalchemy-6BkGyxzeM5aV</guid>
            <description><![CDATA[Bài viết gốc: https://manhhomienbienthuy.github.io/2016/01/11/ky-thuat-scraping-va-crawling-nang-cao-voi-scrapy-va-sqlalchemy.html (đã xin phép tác gi...]]></description>
                        <dc:creator xmlns:dc="http://purl.org/dc/elements/1.1/">manhhomienbienthuy</dc:creator>
            <pubDate>2016-01-14 07:58:45</pubDate>
                                                                                                        </item>
                <item>
            <title><![CDATA[Scraping và crawling Web với Scrapy và SQLAlchemy]]></title>
                        <category>Development</category>
                        <link>https://viblo.asia/p/scraping-va-crawling-web-voi-scrapy-va-sqlalchemy-6BkGyxOLM5aV</link>
            <guid isPermaLink="true">https://viblo.asia/p/scraping-va-crawling-web-voi-scrapy-va-sqlalchemy-6BkGyxOLM5aV</guid>
            <description><![CDATA[Bài viết gốc: https://manhhomienbienthuy.github.io/2015/11/15/grunt-va-5-task-cai-thien-hieu-suat-trang-web-cua-ban.html#cac-task-grunt-giup-cai-thien...]]></description>
                        <dc:creator xmlns:dc="http://purl.org/dc/elements/1.1/">manhhomienbienthuy</dc:creator>
            <pubDate>2015-12-15 04:18:25</pubDate>
                                                                                                        </item>
            </channel>
</rss>
