Как выделить дубли в гугл таблице
Как выделить дубликаты в Google Sheets
При работе с данными в электронных таблицах, скорее всего, у вас есть дубликаты данных. Особенно большая таблица. В Google Sheets есть встроенная функция, которая удаляет дубликаты, но что, если вы хотите выделить только дублирующиеся данные? К счастью, в Google Sheets легко выделить дубликаты, используя несколько различных методов.
Как найти дубликаты в Google Sheets
Первый способ сделать это — выделить дубликаты цветом. Вы можете искать дубликаты по столбцу и автоматически выделять их, заполняя ячейки или изменяя цвет текста.
Перед началом убедитесь, что ваша электронная таблица содержит данные, организованные по столбцам, и каждый столбец имеет заголовок.
Откройте таблицу, которую вы хотите проанализировать в Google Sheets.
Выделите столбец, который вы хотите найти.
Убедитесь, что диапазон ячеек — это то, что вы выбрали на шаге 2.
Введите следующую формулу в новом поле, корректируя буквы для выбранного диапазона столбцов:
В разделе Стиль форматирования выберите цвет заливки для дубликатов ячеек. В этом примере мы выбрали красный.
Вы также можете изменить цвет текста в дублирующих ячейках вместо того, чтобы заполнить его цветом. Для этого щелкните значок цвета текста ( A в строке меню) и выберите свой цвет.
Нажмите Готово, чтобы применить условное форматирование. У всех дубликатов теперь должна быть красная ячейка.
Найти дубликаты в Google Sheets с формулами
Вы также можете использовать формулу, чтобы найти дубликаты данных в ваших электронных таблицах. Этот метод может работать по столбцам или по строкам и отображать повторяющиеся данные в новом столбце или листе в вашем файле.
Найти дубликаты в столбцах с формулой
Поиск дубликатов в столбцах позволяет исследовать один столбец данных, чтобы увидеть, есть ли что-нибудь в этом столбце, который был продублирован.
Откройте таблицу, которую вы хотите проанализировать.
Нажмите на открытую ячейку на том же листе (например, следующий пустой столбец на листе).
Функция формулы активирована.
Выберите столбец, в котором вы хотите найти дубликаты, нажав на букву в верхней части столбца. Формула автоматически добавит диапазон столбцов для вас. Ваша формула будет выглядеть примерно так:
Введите закрывающую скобку в ячейку формулы (или нажмите Enter ), чтобы завершить формулу.
Уникальные данные отображаются в этом столбце для вас, начиная с ячейки, в которой вы ввели формулу.
Найти повторяющиеся строки с помощью формулы
Метод поиска повторяющихся строк в электронной таблице аналогичен, за исключением того, что диапазон ячеек, выбранных для анализа по формуле, отличается.
Откройте таблицу, которую вы хотите проанализировать.
Нажмите на открытую ячейку на том же листе (например, следующий пустой столбец на листе).
Функция формулы активирована.
Выберите строки, которые вы хотите проанализировать на наличие дубликатов.
Нажмите Enter, чтобы завершить формулу. Двойные строки отображаются.
Найти дубликаты в Google Sheets с помощью дополнения
Вы также можете использовать надстройку Google для поиска и выделения дубликатов в Google Sheets. Эти дополнения позволят вам делать больше с вашими дубликатами, например, идентифицировать и удалять их; сравнить данные по листам; игнорировать строки заголовка; автоматическое копирование или перемещение уникальных данных в другое место; и более.
Если вам необходимо разрешить любую из этих ситуаций или если ваш набор данных более надежен, чем три столбца, рассмотрите возможность использования одного из следующих дополнений.
Каждое из этих дополнений ведет себя немного по-разному, но все они позволяют вам находить и выделять дублирующиеся данные, копировать дублирующиеся данные в другое место и удалять дублирующиеся значения или удалять дублирующиеся строки.
Cоветы и руководства по Google Таблицам
Мастер Google Таблиц с полезными советами и руководствами
Как выделить дубликаты в Google Таблицах (шаг за шагом)
При работе с данными в Google Таблицах рано или поздно вы столкнетесь с проблемой дублирования данных. Это могут быть повторяющиеся данные в одном столбце или повторяющиеся строки в наборе данных. Приложив немного условного форматирования, вы можете легко выделить дубликаты в Google Таблицах. После того, как вы их выделите, вы можете решить, сохранить их или удалить.
Выделите повторяющиеся ячейки в столбце
Наиболее распространенная ситуация — это когда у вас есть набор данных в столбце, и вы хотите быстро выделить дубликаты.
Например, предположим, что у вас есть набор данных, показанный ниже, где вы хотите выделить все имена, повторяющиеся в столбце A.

Вышеупомянутые шаги выделят все ячейки с повторяющимися именами указанным цветом.
Как это работает?
При использовании настраиваемой формулы в условном форматировании каждая ячейка проверяется по указанной формуле.
Если формула возвращает значение ИСТИНА для ячейки, она выделяется в указанном формате, а если она возвращает ЛОЖЬ, это не так.
В приведенном выше примере проверяется каждая ячейка, и если имя появляется в диапазоне более одного раза, для формулы СЧЁТЕСЛИ возвращается ИСТИНА, и ячейка выделяется. В остальном он остается без изменений.
Если вы хотите удалить выделенные ячейки, вам необходимо удалить условное форматирование. Для этого выберите ячейки, к которым применено форматирование, щелкните параметр «Формат», щелкните «Условное форматирование» и удалите правило из панели, которая открывается справа.
Выделите повторяющиеся ячейки в нескольких столбцах
В приведенном выше примере у нас были все имена в одном столбце.
Но что, если имена находятся в нескольких столбцах (как показано ниже).
Вы по-прежнему можете использовать условное форматирование, чтобы выделить повторяющиеся имена (которые могут быть именем, которое встречается более одного раза во всех трех столбцах, вместе взятых.
Ниже приведены шаги по выделению дубликатов в нескольких столбцах:
Вышеупомянутые шаги будут выделять ячейку, если имя появляется более одного раза во всех трех выбранных столбцах вместе.

Этот тоже работал последним.
В формуле СЧЁТЕСЛИ (COUNTIF) мы охватили все ячейки в трех столбцах. Таким образом, каждая ячейка в диапазоне проверяется с использованием указанной формулы и возвращает либо ИСТИНА, либо ЛОЖЬ.
Если есть имя, которое повторяется в любом из столбцов, оно будет выделено в указанном формате.
Выделите повторяющиеся строки / записи
Это немного сложно.
Предположим, у вас есть набор данных, как показано ниже, и вы хотите выделить все повторяющиеся записи.
В этом случае запись будет дубликатом, если она имеет точно такое же значение в каждой ячейке в строке (например, в строках 2 и 7 в приведенном выше примере).
Причина, по которой это немного сложно, заключается в том, что теперь вам не нужно проверять отдельные ячейки. Вы должны проверить всю строку и выделить только те строки, в которых повторяются все ячейки.
Но не волнуйтесь, это не так уж и сложно.
Ниже приведены шаги по выделению повторяющихся строк с использованием условного форматирования:
Вышеупомянутые шаги выделят все записи, которые повторяются в наборе данных (как показано ниже).

Этот работает так же, как наш первый пример (где мы просто выделили ячейки в столбце, в котором были дубликаты).
Но поскольку есть целая строка, которую нам нужно сравнить со всеми другими строками, мы объединили содержимое всех строк и создали одну строку для каждой строки.
Следующая часть формулы создает массив строк, в котором объединено все содержимое ячеек в строке (выполняется конкатенация с использованием знака амперсанда).
Этот массив используется в формуле Countif, и используемое условие снова представляет собой объединенную строку, которая имеет все значения в строке. Это делается с использованием следующих критериев:
Теперь это преобразовано в простую конструкцию типа столбца, в которой функция COUNTIF проверяет, сколько раз эта объединенная строка повторяется в созданном нами массиве строк.
В результате будут выделены все повторяющиеся записи.
В Google Таблицах не выделяются дубликаты — возможные причины
Иногда может случиться так, что вы выполните все вышеперечисленные шаги и используете те же формулы, но Google Таблицы по-прежнему не выделяют дубликаты.
Вот несколько возможных причин, по которым вы можете проверить:
Лишние места в камерах
Есть ли лишние пробелы (начальные или конечные пробелы) в тексте в одной ячейке, а не в другой?
Поскольку мы ищем точное совпадение двух или более ячеек, которые будут считаться дубликатами, если в ячейках есть лишние пробелы, это приведет к несоответствию.
Поэтому, даже если вы видите дубликат, он может не выделиться.
Чтобы избавиться от этого, вы можете использовать функцию TRIM (и функцию CLEAN), чтобы избавиться от всех лишних пробелов.
Неправильная ссылка
В Google Таблицах есть три разных типа ссылок.
Если формула требует одного типа ссылки, а вы в конечном итоге используете другие, у вас, скорее всего, возникнет проблема.
Поэтому проверьте ссылки, чтобы убедиться, что Google Таблицы выделяют дубликаты должным образом.
Таким образом, вы можете выделить дубликаты в Google Таблицах с помощью условного форматирования.
Как выделить дубликаты в Google Sheets
Microsoft Excel доминирует на рынке электронных таблиц в течение многих лет. Бизнес и домашние пользователи полагаются на Excel для организации и анализа своих данных. Будь то контрольные списки, бюджеты и финансовые записи, графики или любой другой тип набора данных, Excel упрощает организацию вашей информации. Существовали альтернативы по более низким ценам, и даже в некоторых случаях бесплатно — но если вы хотите самую мощную программу для работы с электронными таблицами, которую вы только можете себе представить, вы захотите использовать Microsoft Excel.
Однако в 2006 году появилась другая альтернатива. Именно тогда Google выпустил Sheets как часть своего веб-пакета офисных приложений для текста, электронных таблиц и презентаций. Процесс разработки продолжался в течение многих лет, и теперь Sheets — хотя пока еще не соответствует фунту за фунт — имеет большой процент стандартных функций Excel. Sheets не стоит своим пользователям сотни долларов на покупку — на самом деле, это абсолютно бесплатно. Хотя это не идеальный продукт, любой, кто ищет надежный инструмент для работы с электронными таблицами на уровне потребителя, на самом деле не должен смотреть дальше, чем Google Sheets. Листы не могут делать все, что может делать Excel, но, скорее всего, вам это не нужно, чтобы делать все, что может делать Excel. Если Sheets делает все, что вам нужно, вам не нужно покупать Excel.
Однако правда в том, что Sheets по-прежнему имеет много ограничений, и некоторые вещи, которые тривиальны в Excel, немного больше работают в Sheets. Вы, вероятно, столкнулись с проблемой, когда вы случайно добавили дубликаты в свою таблицу. В конце концов, чем больше данных вы добавляете, тем больше вероятность того, что вы случайно вставите дублированные данные в электронную таблицу, которая может отбросить набор данных, над которым вы так тяжело работали, чтобы собрать их вместе. Это достаточно плохо, но худшая часть приходит позже, когда вы пытаетесь просмотреть свою работу. Поскольку электронные таблицы могут быть длинными документами, с течением времени становится трудно обнаруживать и удалять дубликаты, что приводит к ошибкам вычислений в вашей работе без очевидного источника того, откуда возникла проблема.
К счастью, мы нашли несколько разных способов выделения дубликатов внутри Google Sheets. Важно, чтобы наш метод не удалял дублирующую информацию автоматически, поскольку не все дубликаты являются ошибками. Но если он только что выделен, то вы можете сами определить, какие из них не нужны, без необходимости просматривать всю электронную таблицу. В этой статье я собираюсь показать вам несколько различных способов выделения или удаления дубликатов данных в таблицах.
Поскольку мы хотим, чтобы Google Sheets автоматически выдвигал на первый план нашу информацию для нас, мы будем использовать формулу, чтобы сказать Sheets, чтобы выдвигать и выделять конкретную, уникальную информацию. Фактически есть два способа заставить Листы выделять скопированную информацию: первый выделяет всю дублированную информацию для подтверждения вручную, а второй копирует уникальные ячейки в выбранный столбец, позволяя вам проверять различия и при необходимости удалять.
Метод 1: выделите дубликаты, используя цвет
Что касается возможности выявления ошибок в ваших электронных таблицах, использование цветных подсветок для выделения любой информации, которая была введена неправильно, является наиболее очевидным и наиболее видимым способом. Выделив информацию, можно очень быстро выявить ошибки, поскольку вы можете просто просмотреть список контента, который вам нужно идентифицировать. На этом шаге мы будем использовать красную подсветку, чтобы идентифицировать дублированный контент, поскольку красный цвет привлекает внимание (особенно по сравнению с обычной белой и серой цветовой схемой листов) и является универсальным цветом для сообщений об ошибках.
Начните с открытия файла Sheets, который вы хотите проверить. Вы хотите убедиться, что ваша информация хорошо организована как по столбцам, так и по строкам, чтобы легко проверить содержимое в вашем документе; Не нужно усложнять собственную работу. Теперь выделите столбец, который вы хотите отсортировать, в верхней части документа и выберите «Формат» в верхнем меню вашего документа. Выберите «Условное форматирование» из списка параметров в этом меню, и в правой части экрана появится альтернативное меню. В этом меню выберите диапазон, используя соответствующие комбинации букв и цифр (например, от A1 до A76).
После того как вы выбрали свой контент, измените «Форматировать ячейки, если» на «Пользовательская формула» в раскрывающемся меню и введите или вставьте следующее без кавычек: «= countif (A: A, A1)> 1» в поле ниже ваше меню. Это завершит формулу для вашего контента. Как только это будет установлено, измените стиль форматирования, чтобы выделить содержимое на фоне красной ячейки, и щелкните значок «Готово» в меню. Ваша электронная таблица теперь будет выделять дублирующиеся ячейки красным цветом, и вы сможете отсканировать выделение на наличие дубликатов. Убедитесь, что все существующие дубликаты верны, а затем удалите те, которые не являются. Закройте меню форматирования, и вы сможете восстановить нормальный цвет ваших ячеек.
Способ 2: копировать только уникальные ячейки
Кроме того, если вы предпочитаете автоматически сортировать необработанные данные, копирование только уникальных ячеек вместо дублирующих ячеек может быть очень полезным для быстрой сортировки и фильтрации. Если вы уверены, что ваша информация верна и вы просто удалите дублирующуюся информацию, которая вам не нужна, попробуйте этот метод.
Как и в последнем шаге, начните с открытия документа, который вы хотите отсортировать внутри Google Sheets. Выделите столбец, который вы хотите редактировать. Как только вы выделите ячейку, щелкните пустую ячейку в верхней части пустого столбца, чтобы убедиться, что ваша информация перемещена в сторону графика. Этот столбец будет использоваться для отображения результатов вашего рода и формулы ниже. Теперь в верхней части документа в поле ввода формулы введите или вставьте следующее без кавычек: «= UNIQUE ()». Эта формула скажет Sheets копировать и отображать только уникальные входные данные ячеек, а также игнорировать любую информацию, которая копирует или дублирует другие ячейки. В скобках приведенной выше формулы обязательно введите координаты ячейки с помощью стандартного метода электронных таблиц (например, ввод (A1: A75) отсканирует всю информацию от столбца A строки 1 до столбца A строки 75). После ввода новой информации нажмите ввод, чтобы переместить новые данные в столбец, который вы указали ранее. После этого вы можете проверить вручную или импортировать данные в рабочую электронную таблицу.
Способ 3: использование дополнения
Следует отметить, что существует ряд плагинов, доступных для использования с Google Sheets онлайн через Интернет-магазин Chrome, включая инструмент для автоматического удаления дублирующихся записей данных из документа. «Удалить дубликаты» — это инструмент с точно названным названием, предлагаемый разработчиками, который позволяет быстро находить дубликаты по всему листу информации или путем поиска до двух столбцов одновременно. Вы можете перемещать, удалять и выделять результаты точно так же, как и в задачах формулы выше, хотя этот процесс гораздо более автоматизирован, чем мы видели ранее, так что имейте это в виду, если вы хотите больше контролировать процесс. Этот инструмент включает в себя две настройки мастера, которые позволяют вам находить и удалять дубликаты или уникальные качества из вашего документа, что позволяет легко отслеживать информацию по мере продвижения.
В целом, использование инструмента-мастера для поиска вашей информации в долгосрочной перспективе может стоить того для пользователей, которые постоянно ищут дубликаты в своих таблицах и по понятным причинам предпочитают тратить свое время на что-то другое, но пользователям, которым нужно проверить только один раз или может быть лучше дважды в несколько месяцев, просто используя инструменты формулы выше, чтобы вручную идентифицировать их информацию. Тем не менее, Remove Duplicates имеет солидный рейтинг в Chrome Web Store, с сильными отзывами и активной командой разработчиков, которая реагирует на критику и жалобы. В целом, это отличный выбор, если вы ищете более удобный способ сортировки контента и поиска дубликатов в электронной таблице.
Метод 4: Использование инструмента удаления дубликатов
Помните, я говорил выше о том, как Google продолжает внедрять новые функции, чтобы расширить возможности Sheets? Ну, так как эта статья была изначально написана, они фактически добавили полнофункциональный инструмент удаления дубликатов в основной пакет. Это очень простой в использовании инструмент, и я проведу вас через него. Давайте возьмем типичную электронную таблицу со списком настольных игр … и если вы внимательно прочитаете, вы увидите, что я внес в список пару дубликатов.
Метод 5: Используйте сводную таблицу, чтобы найти повторяющиеся строки
Sheets реализует полный набор функциональных возможностей сводной таблицы, которая является очень удобным инструментом для более внимательного изучения данных. Использование сводной таблицы не приведет к автоматическому удалению дублирующихся строк; скорее, это обеспечит разбивку, какие строки дублируют, так что вы можете вручную просмотреть свои данные и посмотреть, что, если что-то, пошло не так. Создание сводной таблицы немного сложнее, чем другие методы, которые я показал вам в этой статье, но стоит знать, как это сделать, и я проведу вас через нее.
Сначала выберите все данные таблицы, а затем перейдите в Данные-> Сводная таблица.
Вы можете настроить диапазон данных здесь, если хотите, а также решить, куда должна идти сводная таблица. Я положу его на новый лист и приму диапазон, который я уже дал. Когда мы нажимаем «Создать», в точке вставки открывается пустая сводная таблица… но пустая сводная таблица не приносит нам никакой пользы. Мы должны сказать, какую информацию анализировать.
Мы собираемся выбрать «Добавить» рядом со строками и добавить строку «Заголовок». Затем в разделе «Значения» мы собираемся выбрать «Добавить» и снова выбрать «Заголовок», а затем принять функцию COUNTA по умолчанию. (Если бы мы искали повторяющиеся числовые данные, мы бы использовали COUNT; COUNTA — для подсчета текстовых полей.)
Как только мы сделаем этот выбор, сводная таблица автоматически обновится, и теперь мы можем увидеть конечный результат.
Обратите внимание, что столбец COUNTA содержит количество раз, которое появляется каждый заголовок. Существует 1 для большинства названий, но Axis Союзники и Риск замка оба показывают 2. Это означает, что есть два экземпляра каждого из этих заголовков на графике. Как видите, метод сводной таблицы немного сложнее, но он также дает вам конкретный отчет о том, где находятся ваши дубликаты, что может быть очень полезно для анализа данных.
Электронные таблицы часто немного сложнее, чем аналогичные документы, созданные в Google Docs или Microsoft Word. Поскольку они созданы для работы с организованными данными, важно убедиться, что ваш контент всегда точен. Хранение дубликата ячейки в ваших файлах может действительно вызвать серьезные проблемы с вашими данными, если вы не будете осторожны, особенно когда пытаетесь отсортировать финансовую информацию в полезную электронную таблицу. Усугубляя ситуацию, попытка найти ошибочную ячейку самостоятельно может быть проблемой, которая почти невозможна, если электронная таблица велика. К счастью, идентификация, удаление и удаление идентичных ячеек данных в Google Sheets удивительно просты, и это положительно, если вы постоянно работаете с электронными таблицами в своем повседневном рабочем процессе. И если вы ищете что-то, что облегчает сортировку вашего контента, вы всегда можете использовать надстройку, такую как Remove Duplicates, чтобы убедиться, что ваша информация хорошо отсортирована и хорошо организована. В 2019 году нет причин хранить грязную, заполненную ошибками электронную таблицу, поэтому убедитесь, что ваши данные верны, а ваша информация проверена с использованием методов, описанных выше.
Хотите узнать больше о Google Sheets?
Поиск дубликатов — это одно, но вы должны проверить наш учебник о том, как считать дубликаты в Google Sheets.
Статистики используют функцию абсолютного значения для многих целей, и мы покажем вам, как использовать абсолютное значение в Google Sheets.
Хотите обезопасить свои таблицы? Вот как можно заблокировать формулу в Google Sheets.
Если вы хотите сравнить данные между столбцами, см. Наше полное руководство по сравнению столбцов в Google Sheets.
Знаете ли вы, что вы можете хранить информацию о календаре и расписании в ведомостях? Просто прочитайте наш учебник по работе с информацией о дате и времени в Google Sheets.


















