суббота, 4 апреля 2009 г.

Довел до ума фильтр слов. Вроде неплохо работает. Убирает слова, в которых мало букв, слишком длинные или короткие. Пытается разбить слово на несколько. Код структурирован лучше предыдущей версии.
Пример:
 Было:
246 Map 4930647 1 2007-09-02 16:36:38
246 Social_Software 4930647 1 2007-09-02 16:36:38
246 Web 4930647 1 2007-09-02 16:36:38
467 O.O 4622656 1 2007-09-02 21:34:34
467 europe 4622656 1 2007-09-02 21:34:34
20 by:OscarBronner 4787854 1 2007-09-03 05:51:15
20 fundamental-rights 4787853 1 2007-09-03 06:13:22
870 web2.0 3492253 1 2007-09-03 09:21:55
Стало:
246 map 4930647 1 2007-09-02 16:36:38
246 social 4930647 1 2007-09-02 16:36:38
246 software 4930647 1 2007-09-02 16:36:38
246 web 4930647 1 2007-09-02 16:36:38
467 europe 4622656 1 2007-09-02 21:34:34
20 oscar 4787854 1 2007-09-03 05:51:15
20 bronner 4787854 1 2007-09-03 05:51:15
20 fundamental 4787853 1 2007-09-03 06:13:22
20 rights 4787853 1 2007-09-03 06:13:22
870 web2.0 3492253 1 2007-09-03 09:21:55

Может он пригодится Никите, если он будет работь с новой бибсономией.