wikipedia-dump-stream-parser

❤

npm

wikipedia-dump-stream-parser

1.0.4 • Public • Published 8 years ago

wikipedia-dump-stream-parser

Pure fast javascript only solution to parse wikipedia xml dump.

import {createWikiPageStream} from "wikipedia-dump-stream-parser"

createWikiPageStream(process.stdin).on('data', (page)=>{
    // page.id, page.title, page.content 
}).on('end', ()=>{
    process.exit(0)
});

// skip first 100 pages
createWikiPageStream(process.stdin, 100).on('data', (page)=>{
   // page.id, page.title, page.content 
}).on('end', ()=>{
   process.exit(0)
});

Readme

Keywords

parser
wikipedia
dump
javascript

Package Sidebar

Install

npm i wikipedia-dump-stream-parser

Weekly Downloads

Version

1.0.4

License

ISC

Last publish

8 years ago

Collaborators

Try on RunKit

Report malware

wikipedia-dump-stream-parser

wikipedia-dump-stream-parser

Readme

Keywords

Package Sidebar

Install

DownloadsWeekly Downloads

Version

License

Last publish

Collaborators

Weekly Downloads