npm

@diplodoc/sentenizer
TypeScript icon, indicating that this package has built-in type declarations

0.0.8 • Public • Published

sentenizer

sentenizer — rule-based NLP library for sentence segmentation with russian language support

api

sentenize

takes text of type string and returns segmented sentences as string[]

type

sentenize :: string -> string[]

usage

const {sentenize} = require('sentenizer');

const text = 'Он купил фрукты - яблоки, бананы, и т. д. все были очень рады угощению. Вот такой он добродушный наш родственник И. В. Иванов.';

const sentences = sentenize(text);
// sentences:
// [
//  'Он купил фрукты - яблоки, бананы, и т. д. все были очень рады угощению.',
//  'Вот такой он добродушный наш родственник И. В. Иванов.'
// ]

Package Sidebar

Install

npm i @diplodoc/sentenizer

Weekly Downloads

976

Version

0.0.8

License

MIT

Unpacked Size

30.3 kB

Total Files

17

Last publish

Collaborators

  • makhnatkin
  • yndx-birman111
  • martyanov-av
  • vsesh
  • rndnm
  • v8tenko
  • moki
  • 3y3
  • alexey_w100
  • robot-dataui-npm