Master-X
Форум | Новости | Статьи
Главная » Форум » Программинг, Скрипты, Софт, Сервисы » 
Тема: Как средствами РНР фильтровать не англ. тексты?
цитата
08/12/08 в 18:34
 alexxxus
Добрый день.
Попадаются статьи на разных языках. Можно ли РНР-средствами
выбирать из них только англ. тексты-статьи?

Спасибо.
цитата
08/12/08 в 18:40
 _s_[sov]
легко
Код:
$result = preg_match("#[A-Za-z_]#", $str, $array);
if(empty($result)){
    echo "Yes!\n";
} else {
   echo "No!\n";
}


Последний раз редактировалось: _s_[sov] (08/12/08 в 18:50), всего редактировалось 1 раз
цитата
08/12/08 в 18:40
 xreload
Смотри по коду символов в тексте и отсейкай не нужное.

Т.к. написали выше не делай.
цитата
08/12/08 в 18:43
 _s_[sov]
xreload аргументируй свою точку зрения..
ну ессно что это не лучший способ но можно и так
цитата
08/12/08 в 19:01
 dDan
_s_[sov] писал:
xreload аргументируй свою точку зрения..
ну ессно что это не лучший способ но можно и так

Потому что в тексте есть дохуя пробелом точек запятых двоеточий и т.д
цитата
08/12/08 в 19:05
 _s_[sov]
ну блять пиздец.... я вапще та идею писал а не точную реализацию...

dDan как по точкам и запятым определить язык? icon_smile.gif
цитата
08/12/08 в 19:27
 alexxxus
Ну кириллицу регэксп распознает...
А всякие испанские, португальские и проч. языки романской группы, которые юзают латиницу?
Нужны статьи на англ. только. Не испанский, не французский...
цитата
08/12/08 в 20:35
 dDan
да но у тебя в регулярка есть символ нижнего подчеркивания по нему тоже определяешь язык? icon_cool.gif не будем делать из мухи слона.
ТС читай http://habrahabr.ru/blogs/php/27378/


Эта страница в полной версии