ASE_DAG
Gold Member | Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору 01MDM > s/<h[1-6].*>\(.*\)<h[1-6]>/\1/ Не-не-не, так нельзя. Сед работает в жадном режиме, и в ленивом не умеет. Да и вообще, этим выражением будет сделана не выборка субстрок, а не пойми что (не забывайте, что от <h1> до </h1> — это едва ли вся строка, скорее всего часть строки). Еще раз повторю, что Седом выборку субстрок лучше вообще не делать. Да, а вложенные тэги — это проблема, но в заголовках они редко есть, хотя вполне могут быть. Пойду почитаю ман по Грепу, возможно он и умеет ленивые регэкспы, я, честно говоря, не помню. :) Добавлено: Да, умеет, в режиме --perl-regexp (-P): $ grep -Po '<h[1-6].*?>.*?</h[1-6]>' file.html Вот славно, вложенные тэги — уже не проблема. | Всего записей: 9272 | Зарегистр. 12-05-2005 | Отправлено: 00:50 01-05-2011 | Исправлено: ASE_DAG, 01:22 01-05-2011 |
|