Awesome Image Awesome Image

Удаляем дубликаты из таблиц Google BigQuery

Задача удаления дубликатов из таблицы BigQuery может быть решена разными способами. Рассмотрим несколько из них. Используем ROW_NUMBER Один из вариантов предполагает использование оконной функции ROW_NUMBER для удаления дубликатов. Функция ROW_NUMBER присваивает каждой строке таблицы уникальный номер, который можно использовать для выборки только уникальных записей. Вот как выглядит код для удаления дубликатов с использованием ROW_NUMBER: В […]

Читать далее

Как сделать UPSERT в Google BigQuery?

Существует несколько способов реализации операции UPSERT в BigQuery. Об одном из таких способов я расскажу в этой статье. Для начала давайте представим, что у нас есть таблица из двух полей id и name: Мы хотим выполнить UPDATE записи по ключу id, а если значение с таким ключом не найдено, то выполнить INSERT. Для этого я […]

Читать далее