GEEPERS
Знаток
- Регистрация
- 26 Янв 2008
- Сообщения
- 162
- Реакции
- 25
- Автор темы
- #1
Есть например, HTML-страница:
Как распарсить теги (их содержимое: <a>*</a>, <p>*</p>), каждую категорию в отдельную таблицу в мускуль?
Причем, если напр., тег <р> содержит внутри себя <а>, то <а> не должен попасть в таблицу к <р>.
пока есть такое начало:
HTML:
<html>
<head>
<title>A Title</title>
</head>
<body>
Hello World!
<a href="http://w3.org">HTML</a>
page.
<p>More text... <a href="#">a link</a>, blah-blah-blah.</p>
<img src="img/image.jpg" alt="some image" />
</body>
Причем, если напр., тег <р> содержит внутри себя <а>, то <а> не должен попасть в таблицу к <р>.
пока есть такое начало:
PHP:
$url="http://site.com";
function html_to_array( $url, $element = null )
{
if( !( $data = file_get_contents( $url ) ) )
return false;
preg_match_all( '~<img.*?>(</img>)?~si', $data, $page['img'] );
preg_match_all( '~<p.*?>.*?[^<]</p>~', $data, $page['p'] );
preg_match_all( '~<a.*?[^>].*[^<]</a>~', $data, $page['Link'] );
return !is_null( $element ) ? $page[ $element ] : $page ;
}