Перейти к содержимому



- - - - -

Поиск eMule 0.49c(и в модах) в сети ED2K


  • Закрытая тема Тема закрыта
Сообщений в теме: 9

#1 OFFLINE   drBatty

 

    Долгожитель

  • Юзвери
  • PipPipPipPipPipPipPipPipPipPip
  • сообщений: 1 023
    Последний визит:
    02 Май 2010 14:30
  • Пол:Мужчина
 

Отправлено 26 Январь 2009 - 04:42

Посвящается Марине(Fleur), которая показала мне поиск в eMule, и научила меня им пользоваться.

источник

Эта маленькая статья посвящена поиску файлов по имени в ED2K сети. Ну так-как про поиск по серверам и без меня много понаписано, я об этом и писать не стану(почти). Хотя с другой стороны, если выжать тонны манов о поиске по серверам, то кроме как 3х советов ничего не останется:
  • Ищите транслитом и просто так, по оригинальному названию с (rus)
  • Ищите глобально, однако(хотя глобальный ищет по всем серверам) выбирайте нужный сервер.
  • Ищите кадом, хотя им всё равно ничего не находится.
Советы довольно странные, однако верные. Беда в том, что в муле 4 метода поиска(5, начиная с 0.49), причём все эти методы принципиально разные, и кроме того, кардинально отличаются от того, что обычно понимают под поиском. Ну вот с последнего заблуждения я и начну: Когда говорят "мул нашёл 34 ссылки", подразумевается, что мул обшарил N компов с другими мулами, и выяснил, что в доступных ему компьютерах есть 34 нужных файла. Это не так. И именно от непонимания этого факта и возникает большинство проблем с поиском. Всё дело в том, что мул никогда ничего не ищет. При поиске мул просто формирует нужный запрос, и отправляет его на поисковый сервер. Сервер выдаёт ответ: адреса компьютеров и хеши нужных файлов, подходящих под этот запрос. Важно понять, что так происходит при любом методе поиска. Интересно отметить, что сервер так-же никогда ничего не ищет - просто сразу после того, как какой-нибудь мул подключённый к этому серверу обнаруживает у себя новый файл, этот мул сообщает об этом серверу, а сервер сохраняет адрес и хеш этого файла, причём таким образом, что-бы его моментально извлечь(а не найти!), при запросе. При локальном поиске, и при поиске "в www", если результата не нашлось, поисковый сервер(а значит и мул) выдаёт пустой ответ. При всех остальных методах поиска сервер запрашивает другие сервера. Последнее довольно важно: поиск идёт по текущему серверу, другие сервера запрашиваются только в том случае, если на текущем результатов нет. Поэтому если искать распространённое слово, результат будет зависеть только от текущего сервера(этот сервер просто не попросит о помощи другие, ведь он и сам справляется). И от самого мула это зависит довольно слабо, ищет ведь сервер...

Локальный поиск.
Это самый древний и простой вид поиска: мы отсылаем запрос на наш сервер, он отправляет нам ссылку(ссылки). Но даже здесь возможны сложности. Во первых - выбор сервера. У нас есть список серверов, и мы можем выбрать любой. Рекомендуют для поиска выбирать сервер где файлов больше, а пинг - меньше. Ну пинг это вообще туфта - в моём списке сейчас все сервера с пингом от 0.184секунды, до 0.597, это просто время ответа, и совершенно не важно(как я уже отмечал, сервер вовсе не перебирает все свои файлы в поисках нужного, а просто его извлекает, точнее ссылку на этот файл). А вот число файлов - это важно. Беда в том, что нам не нужно число, нам нужны нужные именно нам файлы. А нужные нам файлы лежат у похожих на нас людей. Глупо было бы искать на "китайском" сервере по запросу
корова
это надо искать на "русском". Однако  вовсе не на том, который в России, а на том, где много русских. Это действительно так: по  этому запросу на сервере который используют англичане, американцы и прочие не-русские мы не найдём ничего(файлов  6 889 036, юзеров 360187, ed2k://|server|87.230.83.44|4661|/), а вот на известном русским сервере(ed2k://|server|89.248.174.84|6543|/ файлов 15 421 534, юзеров 198 729) я нашёл целых 3 коровы. Не следует думать, что бОльшое число файлов приведёт к лучшему результату. Видно, что на нашем сервере(где 3 коровы) сидят менее грамотные юзеры, у которых 77.6 файлов в среднем, а на не нашем в среднем всего 19 файлов. Это говорит о том, что многие с нашего сервера расшарили огромное количество мелких файлов, которые невозможно скачать, так-как к ним огромная очередь, и раздают они(точнее их мулы) вовсе не эти файлы, а то, что сами качают. Во например одна из найденных коров. картинка в 25К и 0 источников на неё.

#2 OFFLINE   drBatty

 

    Долгожитель

  • Юзвери
  • PipPipPipPipPipPipPipPipPipPip
  • сообщений: 1 023
    Последний визит:
    02 Май 2010 14:30
  • Пол:Мужчина
 

Отправлено 26 Январь 2009 - 04:44

Дополнительные возможности ED2K серверов.
Кроме простого поиска нужного нам слова сервера поддерживают также поиск по регулярным выражениям. (регулярные выражения - жутко страшная и мощная штука, вот вам хотя-бы один простенький пример: "#ed2k://\|file\|(.+?)\|(\d{1,16})\|([0-9A-F]{32})\|(/|\|h=[0-9A-Z]{32}\|/|h=[0-9A-Z]{32}\|/)#i", это регулярное выражение - общий вид ed2k-ссылки на файл.) Сервера поддерживают только самые простые регулярные выражения, например запрос
коров*
по тому-же серверу выдаст следующие ссылки(всего найдено 49, но я приведу 7 первых:
Как старик корову продавал (mult).rus.VHSrip.SkipiriQ.64rus.avi
Как.старик.корову.продавал.640x480.avi
Корова.MPG
Коровка Конни 02 - Подарок для мамы.avi
Красавицы Коровы.avi
Секретный полигон - Судьбы русских линкоров. Часть 1.avi
Секретный полигон.Судьбы русских линкоров-2.avi
Можно заметить, что на самом деле ищется не коров*, а *коров*. Насколько я понял, это всё, что умеют сервера(с регулярными выражениями), запросы вида
коров?
а так-же
ко*в
и более сложные не поддерживаются.

Если в запросе несколько слов, ищется файлы в имени которых встречаются все эти слова одновременно, при этом порядок слов не играет роли. Например следующие запросы возвращают одни и те-же файлы:
маша филипп
филипп маша
(три песни киркорова).

Поддерживаются так-же логические выражения, связками в них служат ключевые слова AND, OR и NOT. Их нужно вводить именно большими буквами. На самом деле ключевое слово AND эквивалентно пробелу, и некоторым другим символам(каким именно - зависит от сервера). Поэтому запросы
маша AND филипп
маша-филипп
Возвращают те-же три песни. Запрос
маша OR филипп
возвращает 37 ссылок, в некоторых из которых есть маша, в некоторых есть филипп, а в некоторых - и то, и другое. Запрос
филипп NOT маша
вернёт все файлы где есть маша, но нет филиппа(9 штук). Логические выражения можно заключать в скобки. Не стоит увлекаться мягкими запросами(когда много вариантов), помните, что запрос
*
возвращает конечно много файлов(точное число зависит от мула и от сервера), но среди них вы наверняка не найдёте нужного.
Вообще, следует составлять запрос таким образом, что-бы возвращалось не более 20-50 файлов, если возвращается большее количество, значит, многие ссылки для вас потеряны - следует в самом запросе(или в дополнительных параметрах) отфильтровать заведомо ненужные результаты. К примеру слишком короткие файлы. Можно фильтровать прямо в запросе по имени. К примеру на запросы
lisa
lisa NOT xxx
lisa NOT (xxx OR wmv)
lisa NOT (xxx OR wmv OR sex)
мой мул выдаёт практически одинаковые(по количеству) результаты(309,300,304,309), однако в последнем случае в результатах почти нет порнухи, а в первом - практически только одно порно.

PS: Оказывается в eMule 0.49b, а возможно и в других мулах, логические операторы можно вводить и маленькими буквами: and, or & not. Если вы желаете найти именно слово or, заключите его в кавычки.
command "or" iso
PPS: Но в aMule 2.2.2(2.2.3) логические операторы вводятся большими, а просто слова - маленьким буквами.

#3 OFFLINE   drBatty

 

    Долгожитель

  • Юзвери
  • PipPipPipPipPipPipPipPipPipPip
  • сообщений: 1 023
    Последний визит:
    02 Май 2010 14:30
  • Пол:Мужчина
 

Отправлено 26 Январь 2009 - 04:52

Связанные файлы и поиск по хешу
Изображение
Иногда в муле появляется возможность искать связанные файлы. Связанными файлами называются файлы, которые имеются не менее чем у пяти юзеров одновременно. Т.е. если есть 5 человек у которых одновременно есть файлы X и Y, тогда и только тогда они называются связанными. Но если файл X есть у 100 человек, а файл Y у других 100 - тогда эти файлы не связанны. ED2K сервер позволяет найти все связанные с данным файлы, но только в пределах текущего ED2K сервера(локально для сервера). Первое применение которое приходит в голову - сериалы. К сожалению для сериалов поиск связанных файлов обычно помогает плохо - что-бы найти все серии сериала по одной, нужно что-бы как минимум 5 человек держали в раздаче весь сериал, а кроме того, были бы подключенны к одному и тому-же серверу. К сожалению такое бывает редко(в первую очередь потому, что на сериалы вообще немного источников). Тем не менее найти что-то связанное иногда можно.
вот например песня
ed2k://|file|Lisa%20Stansfield,%20Queen%20&%20George
%20Michael%20-%20Another%20One%20Bites%20The%20Dust.mp3|3471151|DC02C597FC7AB37AE8F847DD1B81C7EA|/
Искать связанные файлы будет вовсе не наш мул, а сервер, мул просто сформирует особый поисковый запрос:
related::DC02C597FC7AB37AE8F847DD1B81C7EA
ничто не мешает нам сформировать такой запрос самостоятельно, например если наша ссылка не в муле, а например на форуме. Мой мул находит на моём сервере  300 связанных файла(просто больше 300 он(мул) не умеет). Конечно исходная ссылка должна иметь много источников(поиск пишет про неё 104, но видимо их намного больше).

Так-же возможно локально и по всем серверам из списка искать ссылки имея только хеш файла:
ed2k::DC02C597FC7AB37AE8F847DD1B81C7EA

Предварительная обработка запроса.
Перед тем как отправить запрос на поисковый сервер мул обрабатывает этот запрос. Фраза делится на слова, причём все большие буквы заменяются на малые(если включено UTF-8, то не только латиница, но и кириллица). Поэтому запросы
ежик
и
ЕжИк
эквивалентны. Однако буква Ё отличается от буквы Е, в словах вроде
Ёжик
следует обязательно заменять букву Ё на Е, перед публикацией(расшариванием) файла. К сожалению при поиске приходится искать и ежик, и ёжик, хотя в большинстве случаев находится именно ежик. Всякие служебные символы(_.-разные скобки и т.д.) игнорируются, однако следует их использовать осторожно: квадратные скобки помешают вам выложить ссылку на форуме, а например < и > недопустимы в www. Вот список символов которые обычно не вызывают проблем:
!()-_+.
Использование других спец символов может помешать вам и/или тем кто будет использовать вашу ссылку. Пробелы и русские буквы преобразуются обычно(не не всегда!) в особый вид UTF-8 кодировки: пробел в %20, а русские буквы в страшные шестисимвольные не читаемые конструкции, вроде
%D0%9E%D0%B4%D0%B8%D0%BD
вот такого... Конечно с русскими буквами ничего не поделать, но вот пробелы можно(и нужно!) заменять, например на поддчерк "_".

#4 OFFLINE   drBatty

 

    Долгожитель

  • Юзвери
  • PipPipPipPipPipPipPipPipPipPip
  • сообщений: 1 023
    Последний визит:
    02 Май 2010 14:30
  • Пол:Мужчина
 

Отправлено 26 Январь 2009 - 04:54

Глобальный поиск.
В отличие от обычного, локального, глобальный поиск ищет не в пределах текущего сервера, а по всем серверам из списка. При этом используется список серверов нашего мула. Именно потому многие хотят иметь побольше серверов в списке - что-бы поиск был лучше. И так-как серверов сейчас немного, если обновлять их правильно, люди опасаются, что самый привычный и хороший поиск теперь будет работать плохо... Однако это не так, практически все муловоды подключены именно к этим немногим серверам, поэтому поиск на других серверах ничего не даст. Вот пример:
подключимся к самому "жирному" сейчас серверу, сегодня это ed2k://|server|212.63.206.35|4242|/ (21.578 миллиона файлов), так  как тот, что я использовал в прошлый раз сегодня не работает(это обычное дело). И попробуем найти что-нибудь редкое, например lism...  Локальный поиск ничего не дал, к сожалению и глобальный тоже :(( Что-ж... подумаем как исправить ситуацию... Есть конечно кад, о нём я напишу позже, но и он сегодня выдал всего 2 ссылки: 1 2, уже что-то, но хочется большего. Что-ж, любой мул умеет добавлять в свой список сервера от присоединённых к нему других мулов, достаточно поставить галочку в настройках-серверах. Стоит установить эту галку, и у нас в списк появится почти 200 серверов! Ура! Уж теперь мы найдём всё... И действительно, по тому-же запросу мы находим:

Изображение

Вот! Налетай! Халява, и кряки, и NoCD, и уже взломанная, готовая к использованию программа! Только и осталось - скачать и поставить. Да и качать не долго, 6188 источников!
СТОП!
А вам ничего не кажется странным?
Ну например то, что локальный поиск не нашёл ничего среди 21578000 файлов? Да и глобальный тоже сначала не смог найти... А стоило подключится к какому-то левому серверу - и нашлось вдруг, да ещё столько всего?.. А то, что один файл одновременно и сама прога версии 1.4.8.1, и кряк к ней, и ещё и NoCD? Что-то подобное я уже описывал в теме про подделки.... Ну что это на самом деле - не знаю. Надо завтра антивирусом поковырять :) Но то, что ничего хорошего - это у точно. Вот ещё любопытная деталь, рассмотрим тех, кто это распространяет:

Изображение

Они все на одно лицо, только страна/город/IP разные. И ники тоже. В остальном - древний 47й клиент, отключена безопасная идентификация, отключён кад, а вот их сервер неизвестен!
Всё просто. То, что скачал я - просто подделка(обоина на десктоп, якобы), с разной заразой, там ещё в комплекте мул идёт. А вот мул - не просто мул, а особый мул. Он ещё делает следующее:
  • всем мулам кто к нему соединяется шлёт сообщение, что он самый лучший.
  • всем файлам которые качает ставит коммент, что он лучший(этот мул), и рейтинг "подделка"
  • ничего не отдаёт, только берёт. на запрос какой-то части отвечает отказом, типа нету.
  • если и раздаёт какие-то файлы - исключительно подделки и самого себя
  • работает как ED2K сервер. При этом никакой информации о юзерах и их файлах не хранит, на все запросы вроде "lism" отвечает: да, есть "lism Crack.zip".
  • при запросе самого себя, или одной из своих подделок отдаёт требуемое, естественно под тем именем какое заказывают(это автоматически получается, имя берётся из ссылки, ссылка из поиска, а в поиск она попадает от этого-же мула).
  • ну там по мелочи, трояны, вирусы, подбор паролей, и прочее...  :evil:
Такие вот дела...

Вот ещё: IPFiltеr НЕ поможет против этой напасти, заражаются компьютеры юзеров... Таких же как мы, только жадных и/или наивных :(

Вывод:
Глобальный поиск простой и удобный. Он сохраняет все плюсы и возможности локального, но кроме того, позволяет искать по всем серверам в списке.
Однако в списке не должно быть поддельных серверов. Так-как запустить такой сервер можно даже в тайне от владельца компьютера(и так и делается), то отфильтровать поддельный фильтр по IP или ещё как-либо невозможно. Только вручную, например проверяя результаты поисков. Конечно можно(и нужно!) воспользоваться уже готовым списком.

#5 OFFLINE   drBatty

 

    Долгожитель

  • Юзвери
  • PipPipPipPipPipPipPipPipPipPip
  • сообщений: 1 023
    Последний визит:
    02 Май 2010 14:30
  • Пол:Мужчина
 

Отправлено 26 Январь 2009 - 04:56

Ещё!
Эта кнопка не работает.  :P Почему? А она и не нужна вовсе. Дело в том, что мул писался не за один день, сначала задумывалось, что если результатов слишком много, для облегчения работы сервера есть смысл сначала послать только первые(100 вроде-бы) результаты, и только если пользователь решит, что это именно то что надо, то сервер после нажатия на "Ещё" отошлёт следующую порцию данных. Нужно заметить, что при создании поисковых систем проблема слишком большого количества результатов намного важнее того, что система не может чего-то найти. В обоих случаях виноват в этом глупый юзер(в большинстве случаев), который неправильно составил поисковый запрос. Сами понимаете, поисковая система не может об этом сообщить ;)
Через некоторое время выяснилось, что отправка с поискового сервера ВСЕХ результатов приведёт к  слишком большой загрузке сервера и сети, а в некоторых случаях просто невозможна(при методе "глобальный" и "кад"). Код клиентов и поисковых серверов был изменён, с учётом этого факта, кнопка "ещё" стала почти всегда неактивна, и даже при её активности не добавляла нужных результатов (пример: найдено 10000 ссылок, мул выводит 500, и 9500 теряет, нажатие "ещё" даст ещё 100 ссылок, но нет разницы, потеряно 9400 или 9500 ссылок).
В версии 49 эта кнопка неактивна, эксперименты показывают, что мул её как бы сам нажимает. Потому, если получено большое количество результатов(более 100), это говорит о том, что большая часть их потерянна. Следует искать по более жёсткому запросу(например воспользуйтесь дополнительными возможностями, см. выше), что-бы не искать заведомо не нужное.
PS: Написал... Однако совсем не правду написал. :twisted:
Обманул вас наивных, прекрасно работает эта кнопка:
Изображение
Вот только работает она далеко не везде, точнее везде, кроме поиска в каде. Всё то, о чём я писал выше, а именно о невозможности получения результатов из када и с других серверов остаётся в силе. Да, действительно не возможно. Сейчас, в eMule 0.49b логика работы этой кнопки следующая: Показывается первые результаты, максимум 300(150 для тех у кого LowID), и если на текущем сервере(и только на нём!, даже при методе "глобальный") есть ещё результаты, кнопка "Ещё" становится активной, при нажатие на неё текущий сервер отдаёт нам известные ему ссылки, максимум ещё 300(150), и так до тех пор, пока либо ссылки не кончатся, либо число результатов приблизится к 2000(1000 для лоу). Вы не знаете зачем кому-то столько? Что-ж, всё просто: во-первых часто жалко терять похожие результаты поиска, возможно они даже ценнее "нужных", а во-вторых, мул поддерживает сортировку  найденного по любому столбцу, так-что часто результаты можно сгруппировать, и выбрать нужные(и сразу поставить на закачку конечно!). Знакомые с SQL запросами вспомнят про GROUP BY. В Kademlia нет никакого "локального" сервера, поэтому кнопка "ещё" там всегда не активна. Ещё раз напомню, что вам нужно правильно выбрать текущий сервер, который знает как можно больше нужных вам файлов. Для поиска русского контента, обновите сервера так, как рекомендует официальный IRC канал поддержки мула #emule-russian (для этого зайдите на этот канал мулом, и наберите !serverlist). После обновления(важно правильно выполнить все пункты, в т.ч. снять галки "обновлять список серверов с...") вам необходимо выбрать сервер из списка на котором больше файлов(обратите внимание: обычно советуют выбирать где больше юзеров и меньше пинг, но ваш случай особый - вам нужен поиск).

#6 OFFLINE   drBatty

 

    Долгожитель

  • Юзвери
  • PipPipPipPipPipPipPipPipPipPip
  • сообщений: 1 023
    Последний визит:
    02 Май 2010 14:30
  • Пол:Мужчина
 

Отправлено 26 Январь 2009 - 04:58

Про моды.
Моды - это улучшенные мулы, когда кто-нибудь придумывает какое-то улучшение мула, это улучшение появляется в первую очередь в моде, и если оно действительно полезное и нужное, переходит в офф версию. Так-же и с поиском. К сожалению, ищет не ваш клиент, ищет поисковый сервер, поэтому слишком многого оптимизацией не добиться, да и не нужно - сменится сервер, этот оптимизированный клиент будет искать намного хуже. А сервера меняются постоянно, и кад-сервера в том числе. Примерно год назад лучше всего мои файлы(да, это и от файлов зависит) искал NeoMule, сейчас он ищет примерно так-же хорошо как и eMule0.49b, похоже код ответственный за поиск в 49й версии заимствован из Neo. В общем пробуйте, возможно ваши файлы есть смысл искать каким-нибудь модом.

"Разгон"
Теоретически без разницы когда искать, однако практика показывает, что поиск даёт больше полезных результатов, если мул долгое время работает(и при этом качает и раздаёт конечно).
  • Только что включенный мул вообще ничего не находит.
  • Мул отработавший полчаса находит мало нужного.
  • Мул отработавший несколько часов находит максимальное количество нужных ссылок.
Причём это так для любого метода поиска.

Почему так происходит с глобальным поиском - даже не знаю. Хотя и подключаюсь к серверу, который работал до того много часов, и уже давно должен "разогнаться", но почему-то происходит именно так. С кадом понятнее, каду нужны узлы, при этом все узлы проверить сразу мул не может(в разных мулах обычное число узлов разное, в eMule0.49b обычно около 800). Сразу после включения даже стрелка када жёлтая, дело в том, что кад сервер(как я уже говорил) отделён от мула, и для проверки его доступности он должен дождаться, пока его проверят другие узлы, кад сервер проверяет узлы из своего списка, а другие узлы проверяют его. Это видно по вкладке "кад":

Изображение Кад сразу после включения, искать пока нельзя...

Изображение Кад сеть включена, и готова к работе.

#7 OFFLINE   drBatty

 

    Долгожитель

  • Юзвери
  • PipPipPipPipPipPipPipPipPipPip
  • сообщений: 1 023
    Последний визит:
    02 Май 2010 14:30
  • Пол:Мужчина
 

Отправлено 26 Январь 2009 - 04:59

Поиск в KAD-сети.
Поиск в каде происходит примерно так-же как глобальный поиск. Однако есть и важные отличия:
  • При глобальном поиске мул ищет на ED2K-серверах, которых 10-20, и на которых около 1000000 файлов, кад сервера отличаются количеством - их несколько миллионов, однако на каждом кад-сервере всего около 1000 файлов(кад сервера это мулы, однако файлы кад-серверов это вовсе не расшаренные файлы этих мулов!).
  • Из-за(a) при поиске в каде невозможно просмотреть все сервера, приходится выбирать направление поиска, для выбора направления используется хеш одного из слов в запросе.
  • В отличие от поиска по серверам, при поиске в каде ищется не слова, а хеши этих слов. Поэтому невозможен нечёткий поиск.
  • Количество кад-серверов огромно, поэтому поиск долгий, хотя и просматривается только часть серверов. Поэтому результат всегда разный.
Поиск в каде происходит следующим образом:
  • Мул разбивает поисковый запрос на  слова, так-же как при поиске по серверу(серверам) специальные символы отбрасываются, и ищется все слова из поискового запроса. Однако это можно изменить, если воспользоваться ключевыми словами AND, NOT, OR, и скобками, так-же как при поиске по серверу.
  • Мул отправляет запрос в кад сеть, главным в запросе является хеш ведущего слова. Ведущее слово это одно из слов в запросе, самое первое, которое длиннее 2х символов. К примеру, по запросу
    в лесу родилась елочка
    ведущем словом будет "лесу", именно к этому слову будут направляться поисковые запросы. Для поиска очень важно правильно выбрать ведущее слово, остальные слова в запросе - просто фильтр.
  • Однако фильтр этот нужен и важен, как я уже писал, без него большинство результатов будет потеряна(так-как результатов без фильтрации слишком много). В данном случае мы потеряем нужные нам файлы по другой причине - из-за буквы ё, правильнее составить запрос так:
    в лесу родилась AND (елочка OR ёлочка)
    тогда несколько Ёлочек не будут для нас потеряны. Следует помнить, что мул не воспринимает фразу полностью, поэтому некоторые слова из запроса можно(а часто и нужно) исключить, к примеру лучшие результаты получаются при таком запросе:
    в лесу AND (елочка OR ёлочка)
    В данном случае у нас не добавятся лишних результатов, за то добавятся некоторые нужные, например найдутся файлы названные с ошибкой в слове "радилась". Если искать только по ведущему слову, результат будет хуже: я получил около 300 ссылок по запросу
    лесу
    однако среди них далеко не все песенки, а в основном вездесущая порнуха :(
  • Запрос вместе с фильтром отправляется на нужный кад-сервер(направление определяет хеш ведущего слова, выбирается сервер(ы) хеш которого больше всего похож на хеш слова. Подробности). Мул подключённый к каду имеет список живых узлов в каде, этот список постоянно обновляется(список хранится в файле nodes.dat). Узлы, которые не смогли ответить на запрос удаляются, на их место мул находит новые узлы. Источником добавления узлов является наша очередь, а так-же те мулы, у в очередях у которых мы стоим, поэтому для успешной работы када нужно постоянно что-то качать и раздавать. Важно отметить, что нет особого смысла ждать, пока узлы стабилизируется, достаточно всего 2-3 часов, для того, что-бы кад заработал в полную силу.
  • Кад-сервер получивший запрос проверяет, не известен ли ему файл, с подобным именем(во первых имя файла должно содержать ведущее слово, и кроме того имя файла и сам файл должен подходить под фильтр). Ещё раз повторю: файлы кад-сервера не имеют отношения к расшареным файлам этого мула.
  • В случае, если серверу такой файл не известен, он отправляет запрос другому серверу, при этом используя свой список узлов.(пункт 5)
  • Если файл найден, ссылка(ссылки) на него(кстати с некоторой дополнительной информацией, которая сегодня пока не доступна, точнее почти не доступна), отправляется тому мулу, который ищет, т.е. к нам.

Примечание:
Я проверял эти примеры, и они работают. Но только у меня Дело в том, что у меня не обычный мул, а aMule . К сожалению обычный мул ничего не будет искать в кад-сети по запросу
в лесу родилась елочка
просто напишет, что в кад сети надо искать слова из 3х букв минимум, это и так, и не так: только ведущее слово должно быть длиннее 2х букв, остальные слова могут быть любой длинны, от 1го до... Ну в разумных пределах ;) что-бы всётаки искать по таким запросам обычным мулом, необходимо и достаточно переставить слова в запросе так, что-бы ведущее слово стало первым(амул это делает автоматически) вот так:
лесу в родилась елочка
Изображение
Я так-же поверил и другие примеры, и получил такие-же результаты:
Изображение

Ещё одно примечание: в новой версии 0.49c эта ошибка исправлена.

#8 OFFLINE   drBatty

 

    Долгожитель

  • Юзвери
  • PipPipPipPipPipPipPipPipPipPip
  • сообщений: 1 023
    Последний визит:
    02 Май 2010 14:30
  • Пол:Мужчина
 

Отправлено 26 Январь 2009 - 05:01

Экранирование запроса.
Очень мешает поиску в кад-сети экранирование: если мы ищем файл, и он есть на ближайшем сервере, этот сервер не станет отправлять запрос дальше, и мы не найдём другие файлы. Поэтому очень многие результаты для нас будут потерянны. Иногда одна ссылка может закрыть собою десятки и сотни других. Что-бы избежать этого, прежде всего необходимо выбрать ведущим словом такое слово, что-бы оно было слабо-распространённым, для того, что-бы наш поисковый запрос прошёл через максимальное число серверов.

Автоматический метод поиска.

Это не для вас.
Почему? Всё просто. Если вы дочитали до этого места данного документа(и даже если вы каким-то образом его(это место) нашли), вы немного больше понимаете обычного lammer on line :dribble: Ну, или хотите понять. Правильно было бы назвать этот метод: "найди хоть как-нибудь!". Логика работы довольно простая: мул поверяет какой из методов(глобальный или кад) доступен, и ищет этим методом. Если доступны оба, мул выбирает "лучший", в кавычках потому, что выше я уже много говорил о разных преимуществах, а главное - недостатках, кждого из методов, лучшего просто не существует. У каждого метода есть свои серьёзные минусы. Если же у вас какой-нибудь из методов недоступен или не работает - значит вы неправильно настроили свой мул, займитесь лучше его настройками, а уж потом - в поиск. Если вы понимаете, что вы делаете, то вы сами выберете тот метод, который вам в данном случае больше подходит. Впрочем - попробуйте и этот...

#9 OFFLINE   drBatty

 

    Долгожитель

  • Юзвери
  • PipPipPipPipPipPipPipPipPipPip
  • сообщений: 1 023
    Последний визит:
    02 Май 2010 14:30
  • Пол:Мужчина
 

Отправлено 26 Январь 2009 - 05:03

Обработка результатов.

Изображение

Обработка результатов поиска -  очень важный этап. Кроме желания и времени вам понадобится ещё и подключить голову. Хотя если вы не читали предыдущие посты, подключаться вам будет просто не к чему :twisted: либо вы получите 0 результатов, либо(что ещё хуже) 300 с лишним, причём ни одного нужного :cry: Однако об этом выше, предположим, что вы всё сделали правильно, и получили некоторое число  результатов, из которых вам нужно выбрать то, что следует качать. Так-как закачать всё обычно не только невозможно, но и нет никакой необходимости. Во первых, разберёмся с цветами, которыми раскрашены результаты поиска. Речь пойдёт только о обычном eMule 0.49b, другие версии и моды не только предлагают какие-то новые цвета, но и по другому понимают стандартные. Итак:

  • Чёрный Это обычные файлы. Мул их в первый раз видит, и источников не много, но есть. Сразу скажу, что источники здесь учитываются только те, которые мул встретил во время поиска, в действительности их может быть намного больше, а также их может быть меньше, даже вообще не быть. Во время поиска мул занимается поиском, а не подсчётом источников, что-бы узнать сколько сейчас источников - поставьте этот файл качаться, иначе никак.
  • Тёмно-синий Говорит о том, что источников довольно много встретилось.
  • Синий Источников много. Это тоже не хорошо. Конечно возможно что их и в правду много, но не факт, что это именно то, что вам нужно.
  • Красный Этот файл уже поставлен качаться. Возможно он даже скачался, и доступен для закачки другими мулами. Красный цвет - предупреждение о том, что этот файл доступен для других через муло-сеть.
  • Зелёный Так обозначаются файлы, которые вы скачали, и удалили из Incoming и из других папок доступных из сети. Это может быть файл который вы удалили, либо просто убрали из своих раздач. Так надо поступать с файлами, у которых и так достаточно много(>50-100) источников, и которые и без вас будут раздавать. Вы им не поможете, и кредитов себе на таком не сделаете. Кроме того, зелёным помечены файлы, которые вы даже не начинали качать, только поставили в закачку, и сразу удалили, хотя я думаю, это не совсем правильно...

Результат представляется в виде таблицы, все столбцы которой можно отключать и включать по желанию(кроме столбца "имя файла"). Так-же возможна сортировка по любому столбцу.

Рассмотрим их подробнее:
  • Имя файла. Имя - это первое попавшееся мулу имя этого файла. Дело в том, что у одного файла может быть несколько имён, в таком случае левее имени будет  плюсик, нажав на который можно посмотреть некоторые имена. Более-менее полный список будет доступен после начала закачки файлов, да и то не сразу. Конечно имя файла вовсе не обязано точно отражать содержимое файла, мало того, часто имя файла(и расширение тоже) не имеет ничего общего с файлом. Такие файлы называются подделки/fakes.
  • Размер Весьма важный столбец. Именно по нему я и обычно сортирую результаты поисков. Только по размеру можно приблизительно определить тип файла, а иногда и его содержимое. К примеру, нормальный фильм в 2 часа физически невозможно сжать в 10 мегабайт. Это не фильм, а в лучшем случае сэмпл, а скорее всего подделка. А если знать точный размер нужного фильма(например из .torrent файла), можно с очень большой вероятностью найти такой фильм в муло-сети. Дело в том, что размер практически невозможно подделать. Однако и тут нужно быть осторожным - существует целый класс подделок, которые имеют нужный размер, но содержимое которых - одни нули. Такие файлы быстро скачиваются, так как мул их компактно упаковывает. Поддельщики учитывают, что кредиты им начисляет из расчёта распакованного блока, а платят за интернет они с учётом упаковки. Что-бы не вляпаться в это, берите ссылки из надёжных источников, и т.д. (ссылка выше) :)
  • Доступность Число источников. Подробнее выше, где про цвета. Довольно бесполезная графа.
  • Полные источники Этот столбец имеет смысл только если найденных источников хотя-бы более 10. Показывает число полных источников в процентах. Если в этом столбце 100%, значит большинство скачавших этот файл его раздают, что косвенно говорит о том, что он им понравился, что(ещё более косвенно) говорит о том, что это хороший файл. Хотя вовсе не обязательно, что этот файл имеет именно нужное вам содержимое. Если источников не менее 10, а полных заметно меньше 100% - то  это либо очень новый файл, который ещё мало кто скачал полностью(хотя все хотят скачать), либо это плохой файл, и многие скачавшие его (почти)сразу удаляют, либо в этом файле некоторые части (почти)недоступны.
  • Тип Этот тип определяет мул. Подробнее о типах опять-таки про подделки. Следует предупредить, что тут мул тоже часто ошибается, и кроме того есть враги, которые его путают и мешают правильно определить тип.
  • IDФайлв Хеш файла. Бесполезный (обычно) столбец, в котором как раз и содержится результат поиска. Если он вам известен - зачем искать? :)
  • Артист и т.д. Эти столбцы заполняют мулы-источники, выдирая данные из тегов мультимедиа контента. Обычно либо не заполнены, либо мул-источник не смог выдрать, либо почему-либо вам это не видно. Но иногда конечно полезные столбцы.
  • Папка. В этом столбце мул пишет папку, в которой находится данный файл, но  только для списка файлов, который был послан вам другим пользователем(подробности о том как просматривать чужие файлы здесь).
  • Известные Тут записаны известные мулу файлы. Про те, что мул видит впервые ничего не написано. Однако для красных может быть "отдача" или "приём", а для зелёных "принят". Последняя надпись(и зелёная подсветка)  появится если поставить галки в настройках-файлах "запоминать загруженные" и/или "запоминать отменённые".


#10 OFFLINE   drBatty

 

    Долгожитель

  • Юзвери
  • PipPipPipPipPipPipPipPipPipPip
  • сообщений: 1 023
    Последний визит:
    02 Май 2010 14:30
  • Пол:Мужчина
 

Отправлено 06 Май 2009 - 04:58

Просмотр сообщенияdrBatty (26th January 2009 - 13:52) писал:

Вот список символов которые обычно не вызывают проблем:
таки всё проблемы вызывает:
например минус "-", в некоторых мулах работает как отрицание, т.е. X-Y значит "искать X, но где нет Y" вот только папаВлад(который об этом писал), не приложил список модов, которые так работают...





Количество пользователей, читающих эту тему: 0

0 пользователей, 0 гостей, 0 анонимных