eagle.jobrunning.crawler.RMResourceFetcher.java Source code

Introduction

Here is the source code for eagle.jobrunning.crawler.RMResourceFetcher.java
Source

/*
 * Licensed to the Apache Software Foundation (ASF) under one or more
 * contributor license agreements.  See the NOTICE file distributed with
 * this work for additional information regarding copyright ownership.
 * The ASF licenses this file to You under the Apache License, Version 2.0
 * (the "License"); you may not use this file except in compliance with
 * the License.  You may obtain a copy of the License at
 *
 *    http://www.apache.org/licenses/LICENSE-2.0
 *
 * Unless required by applicable law or agreed to in writing, software
 * distributed under the License is distributed on an "AS IS" BASIS,
 * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
 * See the License for the specific language governing permissions and
 * limitations under the License.
 */
/**
 * 
 */
package eagle.jobrunning.crawler;

import java.io.IOException;
import java.io.InputStream;
import java.net.URLConnection;
import java.nio.charset.StandardCharsets;
import java.util.Arrays;
import java.util.List;
import java.util.Map;
import java.util.zip.ZipException;

import eagle.jobrunning.config.RunningJobCrawlConfig;
import eagle.jobrunning.counter.parser.JobCountersParser;
import eagle.jobrunning.counter.parser.JobCountersParserImpl;
import eagle.jobrunning.ha.HAURLSelector;
import eagle.jobrunning.ha.HAURLSelectorImpl;
import eagle.jobrunning.job.conf.JobConfParser;
import eagle.jobrunning.job.conf.JobConfParserImpl;
import eagle.jobrunning.util.InputStreamUtils;
import eagle.jobrunning.util.JobUtils;
import eagle.jobrunning.util.URLConnectionUtils;
import org.apache.commons.lang.time.DateUtils;
import org.codehaus.jackson.JsonParser;
import org.codehaus.jackson.map.ObjectMapper;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.slf4j.Logger;
import org.slf4j.LoggerFactory;

import eagle.jobrunning.common.JobConstants;
import eagle.jobrunning.common.JobConstants.CompressionType;
import eagle.jobrunning.common.JobConstants.JobState;
import eagle.jobrunning.common.JobConstants.ResourceType;
import eagle.jobrunning.url.JobCompleteCounterServiceURLBuilderImpl;
import eagle.jobrunning.url.JobCompleteDetailServiceURLBuilderImpl;
import eagle.jobrunning.url.JobCompletedConfigServiceURLBuilderImpl;
import eagle.jobrunning.url.JobCountersServiceURLBuilderImpl;
import eagle.jobrunning.url.JobDetailServiceURLBuilderImpl;
import eagle.jobrunning.url.JobListServiceURLBuilderImpl;
import eagle.jobrunning.url.JobRunningConfigServiceURLBuilderImpl;
import eagle.jobrunning.url.JobStatusServiceURLBuilderImpl;
import eagle.jobrunning.url.ServiceURLBuilder;
import eagle.jobrunning.yarn.model.AppInfo;
import eagle.jobrunning.yarn.model.AppWrapper;
import eagle.jobrunning.yarn.model.AppsWrapper;
import eagle.jobrunning.yarn.model.JobCompleteWrapper;
import eagle.jobrunning.yarn.model.JobCountersWrapper;
import eagle.jobrunning.yarn.model.JobDetailInfo;
import eagle.jobrunning.yarn.model.JobsWrapper;

public class RMResourceFetcher implements ResourceFetcher {

    private static final Logger LOG = LoggerFactory.getLogger(RMResourceFetcher.class);
    private final HAURLSelector selector;
    private final String historyBaseUrl;
    private final ServiceURLBuilder jobListServiceURLBuilder;
    private final ServiceURLBuilder jobDetailServiceURLBuilder;
    private final ServiceURLBuilder jobCounterServiceURLBuilder;
    private final ServiceURLBuilder jobRunningConfigServiceURLBuilder;
    private final ServiceURLBuilder jobCompleteDetailServiceURLBuilder;
    private final ServiceURLBuilder jobCompleteCounterServiceURLBuilder;
    private final ServiceURLBuilder jobCompletedConfigServiceURLBuilder;
    private final ServiceURLBuilder jobStatusServiceURLBuilder;

    private static final int CONNECTION_TIMEOUT = 10000;
    private static final int READ_TIMEOUT = 10000;
    private static final String XML_HTTP_HEADER = "Accept";
    private static final String XML_FORMAT = "application/xml";

    private static final ObjectMapper OBJ_MAPPER = new ObjectMapper();

    static {
        OBJ_MAPPER.configure(JsonParser.Feature.ALLOW_NON_NUMERIC_NUMBERS, true);
    }

    public RMResourceFetcher(RunningJobCrawlConfig.RunningJobEndpointConfig config) {
        this.jobListServiceURLBuilder = new JobListServiceURLBuilderImpl();
        this.jobDetailServiceURLBuilder = new JobDetailServiceURLBuilderImpl();
        this.jobCounterServiceURLBuilder = new JobCountersServiceURLBuilderImpl();
        this.jobRunningConfigServiceURLBuilder = new JobRunningConfigServiceURLBuilderImpl();
        this.jobCompleteDetailServiceURLBuilder = new JobCompleteDetailServiceURLBuilderImpl();
        this.jobCompleteCounterServiceURLBuilder = new JobCompleteCounterServiceURLBuilderImpl();
        this.jobCompletedConfigServiceURLBuilder = new JobCompletedConfigServiceURLBuilderImpl();
        this.jobStatusServiceURLBuilder = new JobStatusServiceURLBuilderImpl();

        this.selector = new HAURLSelectorImpl(config.RMBasePaths, jobListServiceURLBuilder, CompressionType.GZIP);
        this.historyBaseUrl = config.HSBasePath;
    }

    private void checkUrl() throws IOException {
        if (!selector
                .checkUrl(jobListServiceURLBuilder.build(selector.getSelectedUrl(), JobState.RUNNING.name()))) {
            selector.reSelectUrl();
        }
    }

    private List<Object> doFetchApplicationsList(String state) throws Exception {
        List<AppInfo> result = null;
        InputStream is = null;
        try {
            checkUrl();
            final String urlString = jobListServiceURLBuilder.build(selector.getSelectedUrl(), state);
            LOG.info("Going to call yarn api to fetch running job list: " + urlString);
            is = InputStreamUtils.getInputStream(urlString, CompressionType.GZIP);
            final AppsWrapper appWrapper = OBJ_MAPPER.readValue(is, AppsWrapper.class);
            if (appWrapper != null && appWrapper.getApps() != null && appWrapper.getApps().getApp() != null) {
                result = appWrapper.getApps().getApp();
                return Arrays.asList((Object) result);
            }
            return null;
        } finally {
            if (is != null) {
                try {
                    is.close();
                } catch (Exception e) {
                }
            }
        }
    }

    private List<Object> doFetchRunningJobInfo(String appID) throws Exception {
        InputStream is = null;
        InputStream is2 = null;
        try {
            final String urlString = jobDetailServiceURLBuilder.build(selector.getSelectedUrl(), appID);
            LOG.info("Going to fetch job detail information for " + appID + " , url: " + urlString);
            try {
                is = InputStreamUtils.getInputStream(urlString, CompressionType.GZIP);
            } catch (ZipException ex) {
                // Here if job already completed, it will be redirected to job history page and throw java.util.zip.ZipException
                LOG.info(appID + " has finished, skip this job");
                return null;
            }
            final JobsWrapper jobWrapper = OBJ_MAPPER.readValue(is, JobsWrapper.class);
            JobDetailInfo jobDetail = null;
            if (jobWrapper != null && jobWrapper.getJobs() != null && jobWrapper.getJobs().getJob() != null
                    && jobWrapper.getJobs().getJob().size() > 0) {
                jobDetail = jobWrapper.getJobs().getJob().get(0);
            }
            final String urlString2 = jobCounterServiceURLBuilder.build(selector.getSelectedUrl(), appID);
            LOG.info("Going to fetch job counters for application " + appID + " , url: " + urlString2);
            is2 = InputStreamUtils.getInputStream(urlString2, CompressionType.GZIP);
            final JobCountersWrapper jobCounterWrapper = OBJ_MAPPER.readValue(is2, JobCountersWrapper.class);

            return Arrays.asList(jobDetail, jobCounterWrapper);
        } finally {
            if (is != null) {
                try {
                    is.close();
                } catch (Exception e) {
                }
            }
            if (is2 != null) {
                try {
                    is2.close();
                } catch (Exception e) {
                }
            }
        }
    }

    private List<Object> doFetchCompleteJobInfo(String appId) throws Exception {
        InputStream is = null;
        InputStream is2 = null;
        try {
            checkUrl();
            String jobID = JobUtils.getJobIDByAppID(appId);
            String urlString = jobCompleteDetailServiceURLBuilder.build(selector.getSelectedUrl(), jobID);
            LOG.info("Going to fetch job completed information for " + jobID + " , url: " + urlString);
            is = InputStreamUtils.getInputStream(urlString, CompressionType.GZIP);
            final JobCompleteWrapper jobWrapper = OBJ_MAPPER.readValue(is, JobCompleteWrapper.class);

            String urlString2 = jobCompleteCounterServiceURLBuilder.build(historyBaseUrl, jobID);
            LOG.info("Going to fetch job completed counters for " + jobID + " , url: " + urlString2);
            is2 = InputStreamUtils.getInputStream(urlString2, CompressionType.NONE,
                    (int) (2 * DateUtils.MILLIS_PER_MINUTE));
            final Document doc = Jsoup.parse(is2, StandardCharsets.UTF_8.name(), urlString2);
            JobCountersParser parser = new JobCountersParserImpl();
            Map<String, Long> counters = parser.parse(doc);
            return Arrays.asList(jobWrapper, counters);
        } finally {
            if (is != null) {
                try {
                    is.close();
                } catch (Exception e) {
                }
            }
            if (is2 != null) {
                try {
                    is2.close();
                } catch (Exception e) {
                }
            }
        }
    }

    private List<Object> doFetchRunningJobConfiguration(String appID) throws Exception {
        InputStream is = null;
        try {
            checkUrl();
            String jobID = JobUtils.getJobIDByAppID(appID);
            String urlString = jobRunningConfigServiceURLBuilder.build(selector.getSelectedUrl(), jobID);
            LOG.info("Going to fetch job completed information for " + jobID + " , url: " + urlString);
            final URLConnection connection = URLConnectionUtils.getConnection(urlString);
            connection.setRequestProperty(XML_HTTP_HEADER, XML_FORMAT);
            connection.setConnectTimeout(CONNECTION_TIMEOUT);
            connection.setReadTimeout(READ_TIMEOUT);
            is = connection.getInputStream();
            Map<String, String> configs = XmlHelper.getConfigs(is);
            return Arrays.asList((Object) configs);
        } finally {
            if (is != null) {
                try {
                    is.close();
                } catch (Exception e) {
                }
            }
        }
    }

    private List<Object> doFetchCompletedJobConfiguration(String appID) throws Exception {
        InputStream is = null;
        try {
            String urlString = jobCompletedConfigServiceURLBuilder.build(historyBaseUrl,
                    JobUtils.getJobIDByAppID(appID));
            is = InputStreamUtils.getInputStream(urlString, CompressionType.NONE);
            final Document doc = Jsoup.parse(is, "UTF-8", urlString);
            JobConfParser parser = new JobConfParserImpl();
            Map<String, String> configs = parser.parse(doc);
            return Arrays.asList((Object) configs);
        } finally {
            if (is != null) {
                try {
                    is.close();
                } catch (Exception e) {
                }
            }
        }
    }

    public boolean checkIfJobIsRunning(String appID) throws Exception {
        InputStream is = null;
        try {
            checkUrl();
            final String urlString = jobStatusServiceURLBuilder.build(selector.getSelectedUrl(), appID);
            LOG.info("Going to call yarn api to fetch job status: " + urlString);
            is = InputStreamUtils.getInputStream(urlString, CompressionType.GZIP);
            final AppWrapper appWrapper = OBJ_MAPPER.readValue(is, AppWrapper.class);
            if (appWrapper != null && appWrapper.getApp() != null) {
                AppInfo result = appWrapper.getApp();
                if (result.getState().equals(JobConstants.JOB_STATE_RUNNING)) {
                    return true;
                }
                return false;
            } else {
                LOG.error("The status of " + appID + " is not available");
                throw new IllegalStateException("The status of " + appID + " is not available");
            }
        } finally {
            if (is != null) {
                try {
                    is.close();
                } catch (Exception e) {
                }
            }
        }
    }

    public List<Object> getResource(ResourceType resoureType, Object... parameter) throws Exception {
        switch (resoureType) {
        case JOB_LIST:
            return doFetchApplicationsList((String) parameter[0]);
        case JOB_RUNNING_INFO:
            //parameter[0]= appId
            return doFetchRunningJobInfo((String) parameter[0]);
        case JOB_COMPLETE_INFO:
            //parameter[0]= appId
            return doFetchCompleteJobInfo((String) parameter[0]);
        case JOB_CONFIGURATION:
            //parameter[0]= appId
            boolean isRunning = checkIfJobIsRunning((String) parameter[0]);
            if (isRunning)
                return doFetchRunningJobConfiguration((String) parameter[0]);
            else
                return doFetchCompletedJobConfiguration((String) parameter[0]);
        default:
            throw new Exception("Not support ressourceType :" + resoureType);
        }
    }
}