相关推荐recommended
hive数据库delete删除部分数据删除分区内的数据
作者:mmseoamin日期:2024-02-04

Hive delete 删除部分数据

  • 一、hive删除数据
    • 1.1、删除整个表
    • 1.2、删除表中的特定行
    • 1.3、删除表中的特定分区
    • 1.4、删除分区内的部分数据
    • 1.5、清空表中的所有数据
    • 二、扩展
      • 2.1、dynamic partition on Crud si not disabled, please set hive.crud.dynamic.partition=true to enable it

        在Hive中,删除部分数据是一个常见的操作,特别是当我们需要清除不再需要的数据或者进行数据更新时。Hive提供了多种方式来删除部分数据,本文将介绍其中几种常用的方法。

        一、hive删除数据

        1.1、删除整个表

        最简单的方法是删除整个表,这将删除表中的所有数据。可以使用DROP TABLE语句来完成这个操作。下面是一个示例:

        DROP TABLE  my_table;
        

        这将删除名为my_table的表。请注意,这将删除表的元数据和数据。

        1.2、删除表中的特定行

        如果只需要删除表中的部分数据,可以使用DELETE语句。DELETE语句用于删除满足指定条件的行。下面是一个示例:

        DELETE FROM my_table WHERE condition;
        

        其中,my_table是要删除数据的表名,condition是一个表达式,用于指定哪些行应该被删除。例如,要删除my_table表中age大于30的所有行,可以使用以下语句:

        DELETE FROM my_table WHERE age > 30;
        

        这将删除所有age大于30的行。

        1.3、删除表中的特定分区

        如果表是分区的,可以使用DELETE语句删除特定的分区。分区是根据表中的某些列进行划分的,因此可以只删除特定的分区而不影响其他分区。下面是一个示例:

        DELETE FROM my_table PARTITION (partition_column = partition_value);
        或者
        alter table my_table drop partition(partition_column = partition_value)
        

        其中,my_table是要删除数据的表名,partition_column是分区列的名称,partition_value是要删除的分区的值。例如,要删除my_table表中date列为’2022-01-01’的分区,可以使用以下语句:

        DELETE FROM my_table PARTITION (date = '2022-01-01');
        或者
        alter table my_table drop partition(date = '2022-01-01')
        

        这将删除所有date列为’2022-01-01’的分区。

        1.4、删除分区内的部分数据

        若我们只是想删除分区中的指定数据,可以通过以下命令删除

        DELETE FROM my_table PARTITION (partition_column = partition_value) where conditon
        

        例如:删除出生年份为2020年的男生

        DELETE FROM my_table PARTITION (year= '2020') where sex = '男'
        

        1.5、清空表中的所有数据

        如果只需要删除表中的所有数据而不删除表本身,可以使用TRUNCATE语句。TRUNCATE语句用于删除表中的所有行,但保留表的元数据。下面是一个示例:

        TRUNCATE TABLE my_table;
        

        二、扩展

        2.1、dynamic partition on Crud si not disabled, please set hive.crud.dynamic.partition=true to enable it

        在hive数据库中,用delete删除分区内的数据报错,sql及报错内容如下:

        # user表根据year年份字段进行分区,删除2020年分区内的男生
        sql:  delete from user where year = '2020' and sex = '男'
        报错内容:dynamic partition on Crud si not disabled, please set hive.crud.dynamic.partition=true to enable it
        

        解决方法:

        将分区字段放到where前面,语法如下:

        delete from user  partition(year = '2020') where  sex = '男'