Как удалить дубликаты строк регуляркой?

Seegr

Писатель
Регистрация
23 Июн 2016
Сообщения
2
Реакции
0
я в экселе миллион строк сортировал и удалял дубли - очень удобно и достаточно быстро.
Для более миллиона строк использую App.Merge.exe - брать с hasller
 

byNickSan

Создатель
Регистрация
29 Ноя 2017
Сообщения
12
Реакции
5
я в экселе миллион строк сортировал и удалял дубли - очень удобно и достаточно быстро.
Для более миллиона строк использую App.Merge.exe - брать с hasller
KeyWordKeeper юзаю, так проще для больших файлов
 

yr4ik_07

Создатель
Регистрация
29 Июн 2015
Сообщения
10
Реакции
3
Если знаете php то:
1) Берем строки через file
2) далее массив строк пропускаем через array_count_values
3) на выходе имеем массив вида:
значение1 => 2,
значeние2 => 3,
значeние3 => 1

где ключами будут уникальные строки, а значениями их количество
 

soll2307

Постоялец
Регистрация
27 Июл 2009
Сообщения
80
Реакции
9
string result = Regex.Replace(input, @"(?m)^(.+)(?=\s+^\1)", ""); //(на сишарпе)
 

Insendio

Писатель
Регистрация
21 Апр 2018
Сообщения
8
Реакции
6
Вариант без regex:
AkelPad -> Преобразовать -> Удалить дублирующиеся строки, есть еще и другие варианты:
bd4l
 

twocher

Создатель
Регистрация
17 Мар 2018
Сообщения
16
Реакции
3
я в экселе миллион строк сортировал и удалял дубли - очень удобно и достаточно быстро.
Для более миллиона строк использую App.Merge.exe - брать с hasller
Да вы батенька или маньяк или трепач. Excel просто технически начинает тупить при заполнении большого количества ячеек.
 
Сверху