Уникальность контента NG

Статус
В этой теме нельзя размещать новые ответы.
Подскажите пожалуйста, как разместить текст/рекламу внутри новости? (посередине)
 
Подскажите пожалуйста, как разместить текст/рекламу внутри новости? (посередине)

смотря как у тебя отформатирован текст (к примеру- есть ли переводы строк, есть ли абзацы и т.п.) ты можешь понять как текст разделен на смысловые части.

можно тупо разделить строку посередине, но это некрасиво. гораздо интереснее разделить текст ровно по абзацу и вставить туда нужный отрывок.

один из глупых и корявых вариантов, но с ним можно делать несколько вставок:
$t=explode("\n",$text);
$s=round(count($t)/2);
for ($i=0; $i<count($t); $i++){
if ($i==$s){echo "VSTAVKA";}
echo $t[$i];
}
 
  • Заблокирован
  • #53
Подскажите, можно ли вообще проверить контент на уникальность каким-то образом, если я его немного переработал и хочу узнать будет ли он после этой переработки считаться уникальным?
 
смотря как у тебя отформатирован текст (к примеру- есть ли переводы строк, есть ли абзацы и т.п.) ты можешь понять как текст разделен на смысловые части.
можно тупо разделить строку посередине, но это некрасиво. гораздо интереснее разделить текст ровно по абзацу и вставить туда нужный отрывок.
один из глупых и корявых вариантов, но с ним можно делать несколько вставок:
$t=explode("\n",$text);
$s=round(count($t)/2);
for ($i=0; $i<count($t); $i++){
if ($i==$s){echo "VSTAVKA";}
echo $t[$i];
}

а в какой файл это вставлять? или это не в файлах править?
текст вставлять вместо VSTAVKA? можно ли не только текст, а например html

В текстах у меня конечно есть и абзацы (<p>) и перевод строк (<br>), но они же у каждого источника по-разному...
 
а в какой файл это вставлять? или это не в файлах править?
текст вставлять вместо VSTAVKA? можно ли не только текст, а например html

В текстах у меня конечно есть и абзацы (<p>) и перевод строк (<br>), но они же у каждого источника по-разному...

таки конечно надо для начала переводить все тексты в одинаковый вид


меняешь </p> на \n \n (два перевода строки)
меняешь <br> на /n (перевод строки)

получается текст без переводов строк.

ну а текст вставки вставлять вместо "VSTAVKA" :)
желательно вообще plain текст (без html)

затем его можно уже парсить
 
Народ, вы когда-нить будете думать как Яндекс?
Вот вы — Яндекс. Вам дали задачу — определить все сайты которые создаются для нагона трафика и искуственно раскручиваются. Как делать будете, чтобы упроситить работу модератору?
А делать будете:
Если сайта нету-нету и тут сходу (после, например, апа) на него как появились сотни ссылок. То тут варианта два - либо вебмастер понакидал в инете кучу ссылок на свой сайт, либо на сайте настолько интересная новость, что куча сайтов начали на него активно ссылаться. Но тут проще просто на сайт наложить непот, и если вебмастер стукнеться - то уже "руками" проверить этот сайт.
А чтобы не было ложных срабатываний, то еще проще создать парочку каталогов (хоней-потов) и добавить их в базу 1ps, uhuhuh и т.п.
Появился сайт там? Велкам в непот.
...
Небыло-небыло сайта - и тут на нем как появилось тысячи страниц. Варианты:
- либо сайт долго готовился к старту и все эти тысячи страниц заготавливал
- либо понаграбил
Если тысячи страниц и контент не уникальный - стопроцентов награблено.
...
Избежать склейки (других вариантов то и нету:(
1. Грабить из тех мест которые Яндекс не индексирует (такие места есть)
2. Грабить и уникализировать контент:
- Грабить и переписывать в ручную (тоже самое, но своими словами)
- Синонимайзить (но не тупо одно слово на другое, а по-мимо этого разбавлять словами (с привязкой к морфологии)).
- Создавать из кусков другой текст, манипулировать им.

Все. А уж какой способ вы выбирите и как будете организовывать зависит только от вас.
 
1. Но тут проще просто на сайт наложить непот, и если вебмастер стукнеться - то уже "руками" проверить этот сайт.
А чтобы не было ложных срабатываний, то еще проще создать парочку каталогов (хоней-потов) и добавить их в базу 1ps, uhuhuh и т.п.
Появился сайт там? Велкам в непот.



2. Небыло-небыло сайта - и тут на нем как появилось тысячи страниц.

3. - Синонимайзить (но не тупо одно слово на другое, а по-мимо этого разбавлять словами (с привязкой к морфологии)).
- Создавать из кусков другой текст, манипулировать им.

1. ага.у яши тонна админов и их нечем занять?

2. таки тырить потихоньку. пусть растет постепенно. кроме того - под такую гребенку могут попасть многие честные сайты. опять вариант с п.1.

3. ну естественно. если из кусков создавать или синонимизировать то контент по контрольной сумме будет другой.
 
синонимайзер

синонимайзер такую чернуху создаёт , по привязке к морф, что лучше не пробовать, ну мож эт и я накасячил, незнаю. У кого есть положительный опыт?
 
Статус
В этой теме нельзя размещать новые ответы.
Назад
Сверху