精品免费国产,欧美成人在线免费,99综合久久

亚洲视频二区_亚洲欧洲日本天天堂在线观看_日韩一区二区在线观看_中文字幕不卡一区

公告：魔扣目錄網為廣大站長提供免費收錄網站服務，提交前請做好本站友鏈：【網站目錄：http://www.430618.com 】，免友鏈快審服務（50元/站），

網站：51998
待審：31
小程序：12
文章：1030137
會員：747

首頁 > 新聞資訊 > IT業界 >正文

運行Spark作業時CPU使用率較低

發布時間：2024-03-09 00:34:28 作者：網友整理

本文介紹了運行Spark作業時CPU使用率較低的處理方法，對大家解決問題具有一定的參考價值，需要的朋友們下面隨著小編來一起學習吧！

問題描述

我正在運行Spark作業。我有4個內核和設置為5G的工作內存。應用程序主機位于同一網絡中的另一臺計算機上，不承載任何工作進程。這是我的代碼：

private void myClass() {
    // configuration of the spark context
    SparkConf conf = new SparkConf().setAppName("myWork").setMaster("spark://myHostIp:7077").set("spark.driver.allowMultipleContexts", "true");
    // creation of the spark context in wich we will run the algorithm
    JavaSparkContext sc = new JavaSparkContext(conf);

    // algorithm
    for(int i = 0; i<200; i++) {
        System.out.println("===============================================================");
        System.out.println("iteration : " + i);
        System.out.println("===============================================================");
        ArrayList<Boolean> list = new ArrayList<Boolean>();
        for(int j = 0; j < 1900; j++){
            list.add(true);
        }
        JavaRDD<Ant> ratings = sc.parallelize(list, 100)
                    .map(bool -> new myObj())
                    .map(obj -> this.setupObj(obj))
                    .map(obj -> this.moveObj(obj))
                    .cache();
        int[] stuff = ratings
                    .map(obj -> obj.getStuff())
                    .reduce((obj1,obj2)->this.mergeStuff(obj1,obj2));
        this.setStuff(tour);

        ArrayList<TabObj> tabObj = ratings
                    .map(obj -> this.objToTabObjAsTab(obj))
                    .reduce((obj1,obj2)->this.mergeTabObj(obj1,obj2));
        ratings.unpersist(false);

        this.setTabObj(tabObj);
    }

    sc.close();
}

當我啟動它時，我可以在Spark UI上看到進度，但它真的很慢(我必須將Parrallize設置得相當高，否則我會出現超時問題)。我認為這是一個CPU瓶頸，但實際上JVM的CPU消耗非常低(大多數時候是0%，有時略高于5%…)。

根據監視器顯示，JVM使用了大約3G的內存，只緩存了19M。

主主機有4個核心，內存更少(4G)。那臺機器顯示100%的CPU消耗(一個完整的核心)，我不明白為什么它那么高……它只需將分區發送給另一臺計算機上的Worker，對嗎？

為什么工作進程的CPU消耗低，主進程的CPU消耗高？

推薦答案

確保您已在群集中按Yarn或Mesos提交Spark作業，否則它可能只在您的主節點上運行。

因為您的代碼非常簡單，所以完成計算應該非常快，但我建議使用wordcount示例，嘗試讀取幾GB的輸入源，以測試CPU消耗情況。

請使用”local[*]”。*表示使用您的所有核心進行計算

SparkConf SparkConf=new SparkConf().Set(“Spark.driver.host”，”localhost”).setAppName(“unit-testing”).setMaster(“local[*]”)；
參考文獻：https://spark.apache.org/docs/latest/configuration.html

在Spark中，有很多東西可能會影響CPU和內存的使用，例如，執行器和您想要分配的每個.Executor.Memory。

這篇關于運行Spark作業時CPU使用率較低的文章就介紹到這了，希望我們推薦的答案對大家有所幫助，

分享到：

標簽：CPU Spark 作業使用率較低運行