Пример использование нативных SPF-регэкспов

4 messages Options
Embed this post
Permalink
azekeprofit

Пример использование нативных SPF-регэкспов

Reply Threaded More More options
Print post
Permalink
http://www.forth.org.ru/~ygrek/lib/re/re.f

Обкатываю реализацию, дополняя тесткэйсами и пробуя как и что удобнее использовать.

Для примера взял перевод стандарта ANS-94 в текстовом виде: http://www.forth.org.ru/forth/dpans94_ru.rar (~200Кб).

Программа (на данный момент): http://www.forth.org.ru/~profit/dpans-setanchors.f (нужно указать пусть к файлу dpans94_ru.txt из архива)

Результат: http://www.forth.org.ru/~profit/dpans.7z (146 Кб)

И программа и регэкспы пока неокончены. Программе нужны некоторые исправления (правильная трактовка дефиса в квадратных скобках, см. OPEN-FILE) в библиотеке, дополнения (look-ahead [not] equals -- "забегания" вперёд-назад без включения в регэкс-последовательность) для устранения левых срабатываний шаблонов ссылок на параграфы (см. X3.215) и на слова (см. **).

Но уже пока есть на что посмотреть: результат имеет проставленные якоря и внутритекстовые ссылки на параграфы (по шаблону #par1.2.3.4) и на описания слов в стандарте (по шаблону #wordDUP). Поставлены ссылки на страницы, чтобы сохранить работу содержания.
Andrey Cherezov

Re: Пример использование нативных SPF-регэкспов

Reply Threaded More More options
Print post
Permalink
Добрый день, azekeProfit!

Ваше сообщение от 10.10.2007 17:40:

> http://www.forth.org.ru/~ygrek/lib/re/re.f
>
> Обкатываю реализацию, дополняя тесткэйсами и пробуя как и что удобнее
> использовать.
>
> Для примера взял перевод стандарта ANS-94 в текстовом виде:
> [...]
> Но уже пока есть на что посмотреть: результат имеет проставленные якоря и
> внутритекстовые ссылки на параграфы (по шаблону #par1.2.3.4) и на описания
> слов в стандарте (по шаблону #wordDUP). Поставлены ссылки на страницы, чтобы
> сохранить работу содержания.
>  
Если все равно, на чем обкатывать реализацию - может лучше сделать
"викификатор" текста?
Давно нужно избавиться от phpwiki на wiki.forth.org.ru и wackowiki на
eserv.ru, но собственно
wiki нужен и старые страницы тоже. Выделение WikiСлов и вики-разметки в
php традиционно
делается регэкспами, вот будет возможность сравнить удобства реализаций.


-------------------------------------------------------------------------
This SF.net email is sponsored by: Splunk Inc.
Still grepping through log files to find problems?  Stop.
Now Search log events and configuration files using AJAX and a browser.
Download your FREE copy of Splunk now >> http://get.splunk.com/
_______________________________________________
Spf-dev mailing list
[hidden email]
https://lists.sourceforge.net/lists/listinfo/spf-dev
ygrek-3

Re: Пример использование нативных SPF-регэкспов

Reply Threaded More More options
Print post
Permalink
Привет,

> Если все равно, на чем обкатывать реализацию - может лучше сделать
> "викификатор" текста?
> Давно нужно избавиться от phpwiki на wiki.forth.org.ru и wackowiki на
> eserv.ru, но собственно
> wiki нужен и старые страницы тоже. Выделение WikiСлов и вики-разметки в
> php традиционно
> делается регэкспами, вот будет возможность сравнить удобства реализаций.

Для уменьшения порога вхождения было бы неплохо получить базу уже имеющихся
статей, для тестирования. Какие возможности доступны spf на сервере? Какие-то
ограничения есть? Кстати, интересно, какая сейчас нагрузка на вики?

--


-------------------------------------------------------------------------
This SF.net email is sponsored by: Splunk Inc.
Still grepping through log files to find problems?  Stop.
Now Search log events and configuration files using AJAX and a browser.
Download your FREE copy of Splunk now >> http://get.splunk.com/
_______________________________________________
Spf-dev mailing list
[hidden email]
https://lists.sourceforge.net/lists/listinfo/spf-dev

attachment0 (196 bytes) Download Attachment
Andrey Cherezov

Re: Пример использование нативных SPF-регэкспов

Reply Threaded More More options
Print post
Permalink
Добрый день, ygrek!

Ваше сообщение от 14.10.2007 11:08:
> Для уменьшения порога вхождения было бы неплохо получить базу уже имеющихся
> статей, для тестирования.
Отправил тебе ссылки на дампы баз этих двух вик.
>  Какие возможности доступны spf на сервере? Какие-то
> ограничения есть? Кстати, интересно, какая сейчас нагрузка на вики?
>  
На spf никаких ограничений (spf, встроенный в acWEB). Т.е. сможем загрузить
туда любую твою либу.

Нагрузка небольшая - несколько тысяч хостов в день по двум викам в сумме,
где-то около 10 тыщ. хитов в день. Учитывая, что PHP с этим справляется
легко,
Форт даже при совсем неэффективной реализации наверняка будет раз в 30
быстрее, так что можно в начале не беспокоиться об оптимизации.


-------------------------------------------------------------------------
This SF.net email is sponsored by: Splunk Inc.
Still grepping through log files to find problems?  Stop.
Now Search log events and configuration files using AJAX and a browser.
Download your FREE copy of Splunk now >> http://get.splunk.com/
_______________________________________________
Spf-dev mailing list
[hidden email]
https://lists.sourceforge.net/lists/listinfo/spf-dev