亚洲视频二区_亚洲欧洲日本天天堂在线观看_日韩一区二区在线观看_中文字幕不卡一区

公告:魔扣目錄網(wǎng)為廣大站長提供免費(fèi)收錄網(wǎng)站服務(wù),提交前請做好本站友鏈:【 網(wǎng)站目錄:http://www.430618.com 】, 免友鏈快審服務(wù)(50元/站),

點(diǎn)擊這里在線咨詢客服
新站提交
  • 網(wǎng)站:51998
  • 待審:31
  • 小程序:12
  • 文章:1030137
  • 會員:747

本文介紹了使用Spark-avro寫入數(shù)據(jù)幀創(chuàng)建topLevelRecord-要使用現(xiàn)有架構(gòu)的處理方法,對大家解決問題具有一定的參考價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)吧!

問題描述

我正在使用Kryo編碼器將GenericRecords編碼為Spark DataFrame,并將該數(shù)據(jù)幀寫入Avro文件。一旦我嘗試從配置單元中讀取文件,我就得到一個錯誤,說解析器找到的是toplevelRecords而不是預(yù)期的字段。這條記錄不在我現(xiàn)有的模式中,我認(rèn)為它是在我使用Spark-Avro編寫時創(chuàng)建的。我想知道是否/如何從Avro文件中刪除它。

如下所示:

{
    "type":"record",
    "name":"topLevelRecord",
    "fields":[
         {
            "name":"value",
            "type":["bytes","null"]
         }
    ]
} 

推薦答案

名稱字段在Avro架構(gòu)中是必需的(https://jaceklaskowski.gitbooks.io/mastering-spark-sql/spark-sql-AvroOptions.html)

如果架構(gòu)中未設(shè)置值topLevelRecord,則值topLevelRecord是默認(rèn)值,但是您可以提供一個值以在寫入數(shù)據(jù)框時覆蓋它。

Scala:
創(chuàng)建參數(shù)映射并將其傳遞給編寫器:

val name = "AvroTest"
val parameters = Map("recordName" -> name)
df.write.options(parameters).format("avro").save("/tmp/output")

引用:https://docs.databricks.com/spark/latest/data-sources/read-avro.html

Python:
將選項(xiàng)傳遞給編寫器,如下所示:

df.write.format("com.databricks.spark.avro").option("recordName", "Uber").save("tmp/output")

這篇關(guān)于使用Spark-avro寫入數(shù)據(jù)幀創(chuàng)建topLevelRecord-要使用現(xiàn)有架構(gòu)的文章就介紹到這了,希望我們推薦的答案對大家有所幫助,

分享到:
標(biāo)簽:Spark 寫入 創(chuàng)建 數(shù)據(jù) 架構(gòu) 現(xiàn)有 要使
用戶無頭像

網(wǎng)友整理

注冊時間:

網(wǎng)站:5 個   小程序:0 個  文章:12 篇

  • 51998

    網(wǎng)站

  • 12

    小程序

  • 1030137

    文章

  • 747

    會員

趕快注冊賬號,推廣您的網(wǎng)站吧!
最新入駐小程序

數(shù)獨(dú)大挑戰(zhàn)2018-06-03

數(shù)獨(dú)一種數(shù)學(xué)游戲,玩家需要根據(jù)9

答題星2018-06-03

您可以通過答題星輕松地創(chuàng)建試卷

全階人生考試2018-06-03

各種考試題,題庫,初中,高中,大學(xué)四六

運(yùn)動步數(shù)有氧達(dá)人2018-06-03

記錄運(yùn)動步數(shù),積累氧氣值。還可偷

每日養(yǎng)生app2018-06-03

每日養(yǎng)生,天天健康

體育訓(xùn)練成績評定2018-06-03

通用課目體育訓(xùn)練成績評定