Поиск и удаление одинаковых файлов. Как найти одинаковые значения в столбце Excel

Доброго времени суток.

Статистика вещь неумолимая - у многих пользователей на жестких дисках лежат, порой, десятки копий одного и того же файла (например, картинки, или музыкального трека). Каждая из таких копий, разумеется, отнимает место на винчестере. А если диск ваш уже «забит» под завязку - то таких копий может быть достаточно много!

Чистить дубликаты файлов вручную - вещь не благодарная, именно поэтому, я хочу собрать в этой статье программы для поиска и удаления дубликатов файлов (причем, даже тех, которые отличаются и по формату файла, и по размеру друг от друга - а это довольно сложная задача!). Итак…

Список программ для поиска дубликатов

1. Универсальные (для любых файлов)

Осуществляют поиск одинаковых файлов по их размеру (контрольным суммам).

Под универсальными программами, я понимаю, те, которые годятся для поиска и удаления дублей любых типов файлов: музыки, фильмов, картинок и пр. (ниже в статье для каждого типа будет приведены «свои» более точные утилиты). Работают они все в большинстве по одному типу: они просто сравнивают размеры файлов (и их контрольную сумму), если есть среди всех файлов одинаковые по этой характеристике - показывают вам!

Т.е. благодаря ним можно быстро найти на диске полные копии (т.е. один в один) файлов. Кстати, так же отмечу, что данные утилиты работают быстрее, чем те, которые специализированы для конкретного типа файлов (например, поиска картинок).

DupKiller

Эту программу я поставил на первое место по ряду причин:

  • поддерживает просто огромное число разнообразных форматов, по которым она может проводить поиск;
  • высокая скорость работы;
  • бесплатная и с поддержкой русского языка;
  • очень гибкая настройка поиска дублей (поиск по названию, размеру, типу, дате, содержимому (ограниченно)).

Duplicate Finder

Эта утилита, помимо поиска копий, еще и сортирует их так, как вам вздумается (что очень удобно, когда копий находится неимоверное количество!). Так же к возможностям поиска добавьте побайтовое сравнение, сверка контрольных сумм, удаление файлов с нулевым размеромпустых папок тоже). В общем-то, с поиском дублей эта программа справляет довольно неплохо (и быстро, и качественно!).

Немного не комфортно будут себя чувствовать те пользователи, которые плохо знакомы с английским: русского в программе нет (возможно после будет добавлен).

Glary Utilites

Вообще, это не одна утилита, а целый сборник: поможет удалить «мусорные» файлы, задать оптимальные настройки в Windows, дефрагментировать и очистить жесткий диск и т.д. В том числе, в этом сборнике есть утилита для поиска дублей. Работает она относительно не плохо, поэтому я и порекомендую этот сборник (как один из самых удобных и универсальных - что называется на все случаи жизни!) еще раз на страницах сайта.

2. Программы поиска дубликатов музыки

Данные утилиты пригодятся всем меломанам, у которых на диске скопилась порядочная коллекция музыки. Рисую довольно типичную ситуацию: скачиваете различные сборники музыки (100 лучших песен октября, ноября и пр.), часть композиций в них повторяется. Не удивительно, что, накопив музыки на 100 ГБ (к примеру), 10-20ГБ - могут быть копиями. Причем, если бы размер этих файлов в разных сборниках был одинаковый - то их бы можно было бы удалить первой категорией программ (см. выше в статье), но так как это не так - то эти дубли не находятся ничем, кроме вашего «слуха» и специальных утилит (которые представлены ниже).

M usic Duplicate Remover

Результат работы утилиты.

Эта программа отличается от остальных, прежде всего, свои быстрым поиском. Она ищет повторные треки по их ID3 тегам и по звуку. Т.е. она как бы за вас прослушает композицию, запомнит ее, а затем сравнит ее с другими (таким образом, проделывает огромный объем работы!).

На скриншоте выше представлен ее результат работы. Свои найденные копии она представит перед вами в виде небольшой таблички, в которой к каждому треку будет приписана цифра в процентах схожести. В общем, достаточно удобно!

A

Найденные повторные MP3 файлы…

Эта утилита схожа с вышеприведенной, но у нее есть один несомненный плюс: наличие удобнейшего мастера, который будет Вас вести по шагам! Т.е. человек, впервые запустивший эту программу, легко разберется куда нажимать и что делать.

Например, в своих 5000 треках за пару часов, мне удалось найти и удалить несколько сотен копий. Пример работы утилиты представлен на скрине выше.

3. Для поиска копий картинок, изображений

Если анализировать популярность тех или иных файлов, то картинки, пожалуй, не отстанут от музыки (а для некоторых пользователей и перегонят!). Без картинок вообще сложно представить работу за ПК (и другими устройствами)! Но поиск картинок с одинаковым изображением на них - дело довольно трудное (и долгое). И, должен признаться, программ этого рода сравнительно не много…

ImageDupeless

Сравнительно небольшая утилита с довольно неплохими показателями поиска и устранения дублей картинок. Программа сканирует все изображения в папке, а затем сравнивает их между собой. В результате вы увидите список картинок, которые похожи друг на друга и сможете сделать вывод о том, какую из них оставить, а какую удалить. Очень полезно, иногда, прореживать свои архивы фото.

Пример работы ImageDupeless

Кстати, вот небольшой пример личного испытания:

  • подопытные файлы: 8997 файлов в 95 каталогах, 785Мб (архив картинок на флешке (USB 2.0) - gif и jpg форматы)
  • галерея заняла: 71.4Мб
  • время создания: 26 мин. 54 сек.
  • время сравнения и вывода результатов: 6 мин. 31 сек.
  • результат: 961 похожее изображение в 219 группах.

Image Comparer

Об этой программе я уже упоминал на страницах сайта. Представляет собой так же небольшую программу, но с довольно хорошими алгоритмами сканирования картинок. Есть пошаговый мастер, запускающийся при первом открытии утилиты, который проведет через все «тернии» первой настройки программы для поиска дублей.

Кстати, чуть ниже приведен скриншот работы утилиты: в отчетах вы можете просмотреть даже мелкие детали, где картинки несколько различаются. В общем-то, удобно!

4. Для поиска дублей фильмов, видео-роликов

Ну и последний популярный тип файлов, на котором хотелось бы остановиться - это видео (фильмы, ролики и пр.). Если когда-то раньше, обладая 30-50 ГБ диском, знал в какой папке где и какой фильм сколько отнимает (и они все были наперечет), то, например, сейчас (когда диски стали 2000-3000 и более ГБ) - часто встречаются одни и те же ролики и фильмы, но в разном качестве (что может отнять достаточно много места на жестком диске).

Большинству пользователей (да, в общем-то и мне 🙂), такое положение дел не нужно: просто отнимает место на винчестере. Благодаря парочке утилит ниже, вы сможете очистить диск от одинаковых видео…

В сегодняшних Excel файлах дубликаты встречаются повсеместно. К примеру, когда вы создаете составную таблицу из других таблиц, вы можете обнаружить в ней повторяющиеся значения, или в файле с общим доступом внесли одинаковые данные два разных пользователя, что привело к задвоению и т.д. Дубликаты могут возникнуть в одном столбце, в нескольких столбцах или даже во всем листе. В Microsoft Excel реализовано несколько инструментов поиска, выделения и, при необходимости, удаления повторяющихся значений. Ниже описаны основные методики определения дубликатов в Excel.

1. Удаление повторяющихся значений в Excel (2007+)

Предположим, у вас имеется таблица, состоящая из трех столбцов, в которой присутствуют одинаковые записи и вам необходимо избавится от них. Выделяем область таблицы, в которой хотите удалить повторяющиеся значения. Вы можете выделить один или несколько столбцов, или всю таблицу целиком. Переходим по вкладке Данные в группу Работа с данными , щелкаем по кнопке Удалить дубликаты.

Если в каждом столбце таблицы имеется заголовок, установить маркер Мои данные содержат заголовки. Также проставляем маркеры напротив тех столбцов, в которых требуется произвести поиск дубликатов.

Щелкаем ОК, диалоговое окно будет закрыто и строки, содержащие дубликаты будут удалены.

Данная функция предназначена для удаления записей, которые полностью дублируют строки в таблице. Если вы выделили не все столбцы для определения дубликатов, строки с повторяющимися значениями также будут удалены.

2. Использование расширенного фильтра для удаления дубликатов

Выберите любую ячейку в таблице, перейдите по вкладке Данные в группу Сортировка и фильтр , щелкните по кнопке Дополнительно.

Расширенный фильтр, необходимо установить переключатель в положение скопировать результат в другое место, в поле Исходный диапазон указать диапазон, в котором находится таблица, в поле Поместить результат в диапазон указать верхнюю левую ячейку будущей отфильтрованной таблицы и установить маркер Только уникальные значения. Щелкаем ОК.

На месте, указанном для размещения результатов работы расширенного фильтра, будет создана еще одна таблица, но уже с отфильтрованными, по уникальным значениям, данными.

3. Выделение повторяющихся значений с помощью условного форматирования в Excel (2007+)

Выделяем таблицу, в которой необходимо обнаружить повторяющиеся значения. Переходим по вкладке Главная в группу Стили, выбираем Условное форматирование -> Правила выделения ячеек -> Повторяющиеся значения.

В появившемся диалоговом окне Повторяющиеся значения, необходимо выбрать формат выделения дубликатов. У меня по умолчанию установлено светло-красная заливка и темно-красный цвет текста. Обратите внимание, в данном случае Excel будет сравнивать на уникальность не всю строку таблицы, а лишь ячейку столбца, поэтому если у вас имеются повторяющиеся значения только в одном столбце, Excel отформатирует их тоже. На примере вы можете увидеть, как Excel залил некоторые ячейки третьего столбца с именами, хотя вся строка данной ячейки таблицы уникальна.

4. Использование сводных таблиц для определения повторяющихся значений

Воспользуемся уже знакомой нам таблицей с тремя столбцами и добавим четвертый, под названием Счетчик, и заполним его единицами (1). Выделяем всю таблицу и переходим по вкладке Вставка в группу Таблицы, щелкаем по кнопке Сводная таблица.

Создаем сводную таблицу. В поле Название строк помещаем три первых столбца, в поле Значения помещаем столбец со счетчиком. В созданной сводной таблице, записи со значением больше единицы будут дубликатами, само значение будет означать количество повторяющихся значений. Для большей наглядности, можно отсортировать таблицу по столбцу Счетчик , чтобы сгруппировать дубликаты.

Распространенный вопрос как найти и удалить дубликаты в Excel. Предположим вы выгрузили месячный отчет из вашей учетной системы, но в итоге вам нужно понять какие контрагенты вообще взаимодействовали с компанией за этот период — оставить список контрагентов без повтарений. Как отобрать уникальные значения?

Можно ли удалить задвоеные, затроенные и так далее значения в Excel по нескольким столбцам?

Можно, причем очень просто. Для этого есть специальная функция. Предварительно выберите диапазон, где нужно удалять дубликаты. На ленте заходим Данные — Удалить дубликаты (смотрите картинку в начале статьи).

Выбираем первый столбец

При этом важно понимать, что если вы выберите только первый столбец, то все данные в не выбранных столбцах удаляться в случае неуникальности.

Очень удобно!

2. Как выделить все дубликаты в Excel?

Уже слышали про ? Да, здесь оно еще как поможет! Выделяете столбец в котором надо пометить дубликаты, выбираете в меню Главное — Условное форматирование — Правила выделения ячеек — Повторяющиеся значения…

В открывшемся окне Повторяющиеся значения, выберите какие ячейки выделяем (уникальные или повторяющиеся), а так же формат выделения, либо из преложенных, либо создайте Пользовательский формат. Предустановлено форматом будет красная заливка и красный текст.

Нажимаете ОК, если не хотите изменять форматирование. Теперь все данные по выбранным условиям подкрасятся.

Отмечу, что инструмент применяется только для выбранного одного (!) столбца.

Кстати, если нужно увидеть уникальные, то в окне слева выберите — уникальные.

3. Уникальные значения при помощи сводных таблиц

Признаюсь честно, когда-то я не подозревал о существовании возможности «удалить дубликаты» и пользовался сводными таблицами. Как я это делал? Выделяете таблицу, в которых надо найти уникальные значения — Вставка —

Приветствую Вас, уважаемый читатель! Сегодня я Вам покажу программу, которая ищет одинаковые файлы на компьютере. Программа не только находит копии файлов, но и по желанию пользователя, тут же их удаляет. Очень удобно в этом плане. А копий файлов может столько накопится, что Вы даже не будете подозревать об этом. Просто они могут находится в разных папках и даже на разных дисках. Одними Вы может постоянно пользуетесь, а про их копии возможно и забыли.

Вот к примеру, скачали картинку с интернета использовали её в своих целях и забыли о ней. Через некоторое время Вам понадобилась эта картинка, а искать на компьютере лень. Легче найти её в интернете. Снова скачиваете и получаете уже существующий на компьютере дубликат файла.

Так же может произойти и с музыкальными файлами. Скачали в разные папки и считаете что он у Вас в единственном экземпляре. Многие пользователи ПК совершают одну ошибку. Когда зацепив какой-то файл левой клавишей мышки перетаскиваешь его в другую папку, находящуюся на другом диске, то происходит не перемещение, а копирование. А это значит что файл остался на прежнем месте, а в новую папку на другом диске попала его копия.

Получается что один файл лишний и только занимает свободное пространство в памяти компьютера.

Поиск одинаковых файлов

В этой программе есть гибкие настройки с помощью которых мы можем ускорить поиск.

Допустим ищем только на одном или двух дисках. Отмечаем их галочками и жмём кнопку «Сканировать »

Но при этом программа отыщет все файлы у которых есть копии. А нам это не нужно, потому что мы, к примеру, хотим найти только изображения.

Поиск по типу файла

В таком случае переходим на вкладку «Файлы и папки «. Отмечаем галочками формат файла. Изображения бывают разных форматов, но нам программа предлагает только четыре jpg, jpeg, gif, bmp. Это самые популярные форматы изображений, которые есть у практически у каждого пользователя.

Остальные которых нет в списке нужно прописать вручную. Жмём кнопку «Добавить » В открывшемся окошке прописываем нужный формат картинки. Например от программы Photoshop-(*.PSD)

Окей! Сканируем и получаем кучу копий для удаления. Стоп! А они ведь могут быть системные. Значит едем дальше.

Сканируем только нужные папки

Выберем отдельные папки для сканирования. Программа проверит только их. В нижней части программы есть настройка «Искомые папки » Отмечаем пункт «Только указанные папки » при таких параметрах диск во вкладке «Диски » можно не выбирать. Да, и не забудьте выставить галочку здесь «Включать эти папки, даже если соответствующий диск не выбран«

Сканируем и получаем результат. DupKiller по завершению проверки переключится на вкладку «Список » где будут показаны все найденные дубликаты файлов.

Файлы, в нашем случае, это картинки, отсортированы по группам. Группа состоит из двух или нескольких файлов. Они все одинаковые, так как являются копиями друг друга.

Какие файлы удалять?

Щёлкните по любому из файлов в группе, и в окошке предпросмотра Вы увидите миниатюру изображения. Теперь просто прокручивайте колёсико мышки, что бы передвигаться по списку и сравнивать копии между собой.

Вся информация о файле видна на экране программы. И даже если изображение не отображается в окне предпросмотра мы можем сравнить файлы по имени, размеру и типу. В первом столбце под названием «Путь» показано расположение файла.

Удаление одинаковых файлов

Смотрим на эти данные и выделяем по одному файлу в каждой группе. Теперь отмеченные файлы можно удалить нажав на кнопку «Удалить » или «» Так же для удаления можно применить клавишу на «Delete » на клавиатуре.

Если файлов для удаления слишком много, тогда лучше воспользоваться автоматическим удалением файлов. При этом Вы сами выбираете из какой папки удалять одинаковые файлы. как это работает? Выделяете правой клавишей мышки один файл в группе и нажимаете на кнопку «Автовыбор»

В появившемся окошке в верхнем блоке будут отображены пути к папкам в которых есть схожесть между файлами. В нижнем блоке прописаны те же папки, но не отмечены галочками. Нам нужно выбрать одну из этик папок в которой файлы должны быть удалены. Жмём «Ок»

Здесь ещё одна неприятность. Каждый раз при удалении одной из копий появляется окно подтверждения.
Замучаетесь подтверждать. Отключите это уведомление перейдя в настройки «Удаление » и снимите галочки с пункта «Спрашивать подтверждение перед удалением «

Ну, вот и всё. Я поверхностно Вам показал принцип работы программы DupKiller .

Есть желание покопайтесь в дополнительных настройках «Настройки поиска » и «Другие настройки «

А по мне она и так хорошо справляется со своей задачей.

Пишите в комментариях, как вам эта программа и как Вы чистите дисковое пространство то ненужных копий?

Это полезно знать:


Программа для поиска дубликатов файлов чаще всего необходима пользователям, хранящим на диске большое количество музыки, фото и документов.

И, хотя удалять такие лишние копии можно вручную, специализированные приложения способны сэкономить немало времени.

Особенно, если файлы расположены в разных папках или в .

Искать такие дубликаты можно с помощью универсального программного обеспечения или же рассчитанного на конкретный тип данных.

В первом случае повышается скорость поиска, во втором – увеличивается вероятность обнаружить все копии.

Содержание:

Универсальные приложения

Универсальные приложения для поиска копий, в основном, работают по принципу сравнивания размеров файлов.

И, так как вероятность совпадения количества байтов у разных фото практически равна нулю, одинаковые значения считаются признаком дубликата.

Иногда алгоритм предусматривает проверку имён – тоже важный параметр для поиска, тем более что одинаковые данные в большинстве случаев совпадают и по названию.

Преимуществами программ являются возможность найти с их помощью файлы любого типа и сравнительно высокая скорость работы. Недостаток – меньшая точность обнаружения.

Так, например, ни одна из таких утилит не посчитает дубликатом одну и ту же , сохранённую с различным разрешением.

1. DupKiller

А среди её преимуществ можно отметить:

  • простоту настройки;
  • установку нескольких критериев поиска;
  • возможность игнорировать некоторые файлы (с определённым размером или датой создания, а также системные или скрытые).

Важно: При обнаружении файлов с нулевым размером их не обязательно удалять. Иногда это может быть информация, созданная в другой операционной системе (например, Linux).

Рис. 4. Программа для оптимизации системы CCleaner может искать и дубликаты файлов.

5. AllDup

Среди преимуществ ещё одной программы, AllDup , можно отметить поддержку любой современной операционной системы Windows – от XP до 10-й.

При этом поиск ведётся и внутри скрытых папок, и даже в архивах.

Хотя сравнение информации по умолчанию происходит по названиям файлов, поэтому настройки желательно сразу же изменить.

Зато в процессе поиска каждый найдённый дубликат можно просмотреть, не закрывая приложение.

А при обнаружении копии её можно не только удалить, но и переименовать или перенести в другое место.

К дополнительным преимуществам приложения относится и полностью бесплатная работа в течение любого периода времени.

Кроме того, производитель выпускает ещё и портативную версию для того чтобы искать копии на тех компьютерах, на которых запрещена установка постороннего ПО (например, на рабочем ПК).

Рис. 5. Поиск файлов с помощью portable-версии AllDup.

6. DupeGuru

Ещё одним полезным приложением, проводящим поиск дубликатов с любым расширением, является DupeGuru .

Её единственный недостаток – отсутствие новых версий для Windows (при этом обновления для и MacOS появляются регулярно).

Впрочем, даже сравнительно устаревшая утилита для неплохо справляется со своими задачами и при работе в более новых ОС.

С её помощью легко обнаруживаются даже системные файлы, а меню интуитивно понятное и русскоязычное.

Рис. 6. Обнаружение копий с помощью утилиты DupeGuru.

Примечательно, что, кроме обычного универсального варианта, компания-производитель создала утилиту для поиска файлов определённого типа.

Существует отдельная версия для изображений и ещё одна для музыки.

И, при необходимости очистить свой компьютер не только от документов и системных файлов (которые, кстати, требуется удалять очень осторожно – иногда стоит даже оставить «лишнюю» копию, чем нарушить работоспособность системы), стоит скачать и эти приложения.

7. Duplicate Cleaner Free

Утилита для обнаружения копий любого файла Duplicate Cleaner Free отличается следующими особенностями:

К её недостаткам относят небольшие ограничения при поиске изображений (для этого рекомендуется приобрести платную версию) и не совсем точный перевод отдельных элементов меню .

Тем не менее, благодаря своей эффективности и удобству использования, приложение пользуется определённой популярностью.

Рис. 7. Поиск дубликатов с помощью утилиты Duplicate Cleaner Free.

Поиск дубликатов аудио файлов

Если результаты поиска дубликатов не устраивают пользователя, можно рассмотреть вариант, предназначенный для определённых файлов. Например, для , скопившейся на диске.

Такая необходимость часто возникает при загрузке сразу нескольких альбомов и сборников одного и того же исполнителя – нередко в разных папках оказываются одинаковые треки.

Они могут иметь похожие размеры и отличаться, по большому счёту, только названиями. Специально для этого существуют утилиты для поиска похожих мелодий.

8. Music Duplicate Remover

Среди особенностей программы Music Duplicate Remover – сравнительно быстрый поиск и неплохая эффективность.

Фактически, это приложение как бы «прослушивает» композицию и проводит её сравнение с другими аудио файлами.

При этом, естественно, время её работы больше, чем у универсальных утилит.

Однако количество проверяемых программой данных, как правило, в десятки раз меньше, поэтому средняя продолжительность проверки редко превышает пару часов.

Рис. 8. Обнаружение копий музыки и аудио файлов по альбомам.

9. Audio Comparer

При этом анализ фото тоже длится дольше по сравнению с поиском файлов любого расширения, но результат оправдывает себя.

Изображения определяются даже в том случае, когда на диске находятся несколько дубликатов одной картинки, но с разным разрешением и, соответственно, размером.

Кроме того, для повышения эффективности проверяются файлы с любыми графическими расширениями – от до.png.

Рис. 11. Поиск картинок с помощью ещё одной версии DupeGuru.

12. ImageDupeless

При этом она распространяется бесплатно и имеет русский интерфейс. А производитель периодически выпускает к ней обновления, повышая эффективность поиска изображений.

Рис. 12. Стильный интерфейс приложения ImageDupeless.

13. Image Comparer

Преимуществами приложения Image Comparer , кроме простого интерфейса, можно назвать наличие пошагового мастера, позволяющего научиться быстрому и результативному поиску изображений.

Эта особенность отличает утилиту от большинства остальных, для работы с которыми придётся читать файлы справки, не всегда правильно переведённые (а иногда и вообще предоставляемые только на английском).

Фактически, приложение является ещё одной версией Audio Comparer, и тоже распространяется по «условно бесплатной» лицензии – то есть за определённые функции пользователю придётся заплатить.

Рис. 13. Приложение Image Comparer – неплохой способ найти дубликаты картинок.