Сделать стартовой Добавить в избранное
 
Панель управления
логин :  
пароль :  
   
   
Регистрация
Напомнить пароль?
SatFish.info - Всё для спутниковой интернет рыбалки! » Статьи » Описание файла Regex.txt
Навигация по сайту
Новости Статьи
Программы Разное
ФОРУМ
 
Расширенный поиск
Наш опрос
Откуда Вы к нам пришли?

Из поисковиков
Из каталогов
Из топа Mail.Ru
Из топа Rambler.Ru
Из сайта SamLab.WS
Из сайта Epidem.Ru
Знакомые дали ссылку
Из других сайтов
Ссылки #1
DnRemont.ru: шторы щелково

разрешение на работу для иностранцев

Расчет и критерии характеристик надежности

the greatest sports betting forum .
Ссылки #2



 


 

Статьи : Описание файла Regex.txt
 
Начнем с того, что это за файл. В этом файле перечисленные фильтры, которые вы можете увидеть в программе SkyNET по нажатию на кнопку G.
Для чего они нужны? Для того, чтобы получать только интересные вам файлы при грабинге. Новичкам можно использовать стандартный regex.txt, который идет со многими билдами программы (например SkyNET 0.93d). Но гораздо интересней настроить этот файл под свои нужды и потребности.
Итак, как работает этот файл? Все очень просто. Когда skynet зацепил какой-то файл, он начинает проверять фильтры построчно из файла regex.txt. При первом же совпадении дальше проверка не идет. То есть, условия стоящие выше в regex.txt имеют больший приоритет. Именно поэтому во всех (почти) regex’ах сначала идут BLOCK-строчки, которые отсеивают ненужные файлы сразу.

Теперь перейдем к описанию самого формата фильтров.
Строчка условия состоит из четырех частей

1) Цвет полоски для данного типа файла
2) Способ определения файла
3) Условие
4) Группа, к которой принадлежит файл

Рассмотрим все поподробнее:
1) Это стандартный цвет, задаваемый тремя группами в шестнадцатеричном виде. В программах для рисования или корректировки фоток (например, фотошоп) при выборе цвета можно увидеть этот самый код. Тут все стандартно (FFFFFF – белый, FF0000 – красный, 00FF00 – зеленый и тд)

2) Здесь возможны 2 варианта:
- b – определять по содержимому (в начале файла)
- t – определять по полю content-type

3) Это самая важная и сложная часть. Здесь задается условие отбора.
Если способ определения файла b, тогда условия задаются с помощью регулярных выражений, позаимствованных в UNIX.
Формат следующий: сначала ставится знак «^» - это определение начала строки.

Далее перечисляются символы, которые идут по порядку в файле (например, ^Rar, означает, что все файлы начинающиеся с символов Rar. удовлетворяют условию).

Если в файле на каком-то месте возможен любой произвольный символ, то его можно обозначить «.» (точкой) (например, ^RIFF....AVI, означает, что данному условию удовлетворяют файлы, у которых первые 4 символа RIFF, далее идут любые 4 символа, а далее 3 символа AVI).

Если вам нужно описать последовательность любых символов неопределенной длины, тогда применяется сочетание «.*» (вообще звездочка указывает на повторение символа 0 или более раз, а так как перед ней стоит точка, значит повторяться будет любой символ) (например, ^PK.*NAV, означает, что данному условию удовлетворяют файлы, у которых первые два символа PK, а далее в любом месте начала файла есть последовательность символов NAV).

Если вам нужно в качестве символа указать точку (например фильтровать расширения .mp3, точка все таки задана явно), то просто точку поставить нельзя, так как программа определит ее как любой символ, поэтому применяется сочетание символов «\.» (например, ^PK.*\.wmv, означает, что файлам, у которых первые два символа PK, далее в любом месте начала файла есть последовательность .wmv, это условие удовлетворяет).

Если последовательность символов может быть написана в разных регистрах (например, rar или RAR), тогда применяется выражение (?i) перед этой последовательностью (например, ^PK.*(?i)MANIFEST, означает, что файлам, в начале которых 2 знака PK и в любом месте встречается последовательность MANIFEST, написанная в любом регистре, хоть MaNifeSt, удовлетворяет условию).

Возможно указание условий (альтернативы) выбора. Например, к какой-то группе могут принадлежать файлы с разным началом, тогда применяется следующее выражение ^(усл1|усл2| … |услN) (Например, ^.*<(?i)(html|!doctype|head|body), означает, что файлам, содержащим в любом месте последовательность
Вроде основные описал, вот список всех метасимоволов (символы обозначающие группы других символов) и их модификаторов:
\ - считать следующий метасимвол как обычный символ.
^ - начало строки
. - один произвольный символ.
$ - конец строки
| - альтернатива (или)
() - группировка
[] - класс символов

Метасимволы имеют модификаторы (пишутся после метасимвола):
* - повторяется 0 или большее число раз
+ - повторяется 1 или большее число раз
? - 1 или 0 раз
{n} - точно n раз
{n,} - по меньшей мере раз
{n,m} - не меньше n, но и не больше m

Если способ определения файла t, тогда просто вписывается значение поля content-type.
(например, ^image/jpeg – означает картинки в формате JPEG, ^application/msword – означает документы, написанные в Word'е)

4) Здесь указывается присваиваемое расширение файлу и через «;» группы файлов (необязательно).

В конце файла обычно пишут строчку
404040 b . bin;ALL,
которая удовлетворяет всем файлам (означает, что если файл не попал не в одно условие, ему присваивается расширение bin).

Совет: внимательно расставляйте порядок условий, иначе можно не получить желаемый результат.
Например, я хочу ловить rar-архивы с музыкой в формате mp3, а другие rar-архивы я ловить не хочу. Если у меня будет последовательность записана так:

008000 b ^Rar! rar
008000 b ^Rar!.*\.mp3 mp3.rar


И в программе отмечу плюсом группу mp3.rar и не отмечу rar, то я ничего не поймаю, так как архивы с музыкой также попадают под общее определение архивов, а я их не указал. Чтобы все заработало, нужно поменять порядок строк (поменять местами):

008000 b ^Rar!.*\.mp3 mp3.rar
008000 b ^Rar! rar


ps Уже предчувствую кучу вопросов, уточнений, изменений, все в форум в раздел «Грабинг», там будет вестись специальная ветка, посвященная этому вопросу.

Удачной рыбалки!!!

Внимание! Владельцем данной статьи является сайт www.ulov.net.
 
 
 
Уважаемый посетитель, Вы зашли на сайт как незарегистрированный пользователь. Мы рекомендуем Вам зарегистрироваться либо войти на сайт под своим именем.
 
 
  • Описание смысла рыбалки для новичков!!!
  • File Type Verificator 0.99
  • Segment Manager v1.0.4.94
  • Рыбалка со спутника. Что? Где? и Как?
  • Crystal Sorter
  •  
     
     (голосов: 3)
    Комментарии (7)  Распечатать
     
     
    #1 написал: sintflora
     



    Группа: Посетители
    Регистрация: 15.07.2008
    Спасибо feel
     
     
    Публикаций: 0 | Комментариев: 14 цитировать    
     
     
    #2 написал: jacobson
     



    Группа: Посетители
    Регистрация: 23.07.2008
    Вот. Стою у дверей в ресторан. feel
    А охота ведь пуще неволи! feel
    Всё прощающий в жизни обман, feel
    На краю ожидания доли. feel

    Я зайду в это чрево и там feel
    Принесут мне меню в коленкоре. feel
    Мёд и пиво текут по устам, feel
    Заливая горючее горе. feel
     
     
    Публикаций: 0 | Комментариев: 15 цитировать    
     
     
    #3 написал: JesusChrist
     



    Группа: Посетители
    Регистрация: 26.07.2008
    Спасибо! smile
    Спасибо smile за то, что вы есть smile
     
     
    Публикаций: 0 | Комментариев: 20 цитировать    
     
     
    #4 написал: JesusChrist
     



    Группа: Посетители
    Регистрация: 26.07.2008
    Первый wink Автору 1! smile Спасибки! smile мне понравалось! lol Сайт в избранном и отправил ссылку друзьям. smile smile smile
     
     
    Публикаций: 0 | Комментариев: 20 цитировать    
     
     
    #5 написал: JesusChrist
     



    Группа: Посетители
    Регистрация: 26.07.2008
    Это не совсем кстати, но действительно у Вас очень актуальный сайт. lol Спасибо smile smile smile
     
     
    Публикаций: 0 | Комментариев: 20 цитировать    
     
     
    #6 написал: basmaser
     



    Группа: Посетители
    Регистрация: 1.08.2008
    Классная новость!!! lol Да и сайт классный! smile Зачет!!!! smile З.Ы. Мужик где такие новости берешь??? smile smile smile
     
     
    Публикаций: 0 | Комментариев: 19 цитировать    
     
     
    #7 написал: Ant0ha1
     



    Группа: Посетители
    Регистрация: 8.08.2008
    Хорошая информация
     
     
    Публикаций: 0 | Комментариев: 15 цитировать    
     
     
    Добавление комментария