Regex pattern для русских комментариев в исходниках C/C++/C#
От: -DIS-  
Дата: 04.07.06 09:40
Оценка:
Задача заключается в парсинге файла на предмет русскоязычных комментариев в файлах исходных кодов C/C++/C#
Необходимо выбрать все комментарии, содержащие минимум 1 русский символ.


string ruComment = @".*[а-яА-Я]+.*";
Regex comment = new Regex(@"(/\*" + ruComment + @"\*/)|(//" + ruComment + @"$\n)");

В таком случае в коллекцию совпадений падают все однострочные комментарии (вида // CommentContent) и часть многострочных (вида /* CommentContent */), если весь комментарий находится в одной строке.

Как нужно изменить паттерн, чтобы под него подходили все многострочные комментарии?
Возможно ли силами Regex объединять группу последовательно идуищх однострочных комментариев в один?

Зарание всем спасибо
 
Подождите ...
Wait...
Пока на собственное сообщение не было ответов, его можно удалить.