org.sonar.batch.cpd.JavaCpdEngine.java Source code

Introduction

Here is the source code for org.sonar.batch.cpd.JavaCpdEngine.java
Source

/*
 * SonarQube, open source software quality management tool.
 * Copyright (C) 2008-2014 SonarSource
 * mailto:contact AT sonarsource DOT com
 *
 * SonarQube is free software; you can redistribute it and/or
 * modify it under the terms of the GNU Lesser General Public
 * License as published by the Free Software Foundation; either
 * version 3 of the License, or (at your option) any later version.
 *
 * SonarQube is distributed in the hope that it will be useful,
 * but WITHOUT ANY WARRANTY; without even the implied warranty of
 * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
 * Lesser General Public License for more details.
 *
 * You should have received a copy of the GNU Lesser General Public License
 * along with this program; if not, write to the Free Software Foundation,
 * Inc., 51 Franklin Street, Fifth Floor, Boston, MA  02110-1301, USA.
 */

package org.sonar.batch.cpd;

import com.google.common.collect.Iterables;
import com.google.common.collect.Lists;
import org.apache.commons.io.IOUtils;
import org.slf4j.Logger;
import org.slf4j.LoggerFactory;
import org.sonar.api.CoreProperties;
import org.sonar.api.batch.fs.FilePredicates;
import org.sonar.api.batch.fs.FileSystem;
import org.sonar.api.batch.fs.InputFile;
import org.sonar.api.batch.fs.internal.DefaultInputFile;
import org.sonar.api.batch.sensor.SensorContext;
import org.sonar.api.batch.sensor.duplication.NewDuplication;
import org.sonar.api.batch.sensor.duplication.internal.DefaultDuplication;
import org.sonar.api.batch.sensor.measure.internal.DefaultMeasure;
import org.sonar.api.config.Settings;
import org.sonar.api.measures.CoreMetrics;
import org.sonar.api.resources.Project;
import org.sonar.api.utils.SonarException;
import org.sonar.batch.cpd.index.IndexFactory;
import org.sonar.batch.cpd.index.SonarDuplicationsIndex;
import org.sonar.duplications.block.Block;
import org.sonar.duplications.block.BlockChunker;
import org.sonar.duplications.detector.suffixtree.SuffixTreeCloneDetectionAlgorithm;
import org.sonar.duplications.index.CloneGroup;
import org.sonar.duplications.index.CloneIndex;
import org.sonar.duplications.index.ClonePart;
import org.sonar.duplications.java.JavaStatementBuilder;
import org.sonar.duplications.java.JavaTokenProducer;
import org.sonar.duplications.statement.Statement;
import org.sonar.duplications.statement.StatementChunker;
import org.sonar.duplications.token.TokenChunker;

import javax.annotation.Nullable;

import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.InputStreamReader;
import java.io.Reader;
import java.util.Collection;
import java.util.HashSet;
import java.util.List;
import java.util.Set;
import java.util.concurrent.Callable;
import java.util.concurrent.ExecutionException;
import java.util.concurrent.ExecutorService;
import java.util.concurrent.Executors;
import java.util.concurrent.TimeUnit;
import java.util.concurrent.TimeoutException;

public class JavaCpdEngine extends CpdEngine {

    private static final Logger LOG = LoggerFactory.getLogger(JavaCpdEngine.class);

    private static final int BLOCK_SIZE = 10;

    /**
     * Limit of time to analyse one file (in seconds).
     */
    private static final int TIMEOUT = 5 * 60;

    private static final int MAX_CLONE_GROUP_PER_FILE = 100;
    private static final int MAX_CLONE_PART_PER_GROUP = 100;

    private final IndexFactory indexFactory;
    private final FileSystem fs;
    private final Settings settings;
    private final Project project;

    public JavaCpdEngine(@Nullable Project project, IndexFactory indexFactory, FileSystem fs, Settings settings) {
        this.project = project;
        this.indexFactory = indexFactory;
        this.fs = fs;
        this.settings = settings;
    }

    public JavaCpdEngine(IndexFactory indexFactory, FileSystem fs, Settings settings) {
        this(null, indexFactory, fs, settings);
    }

    @Override
    public boolean isLanguageSupported(String language) {
        return "java".equals(language);
    }

    @Override
    public void analyse(String languageKey, SensorContext context) {
        String[] cpdExclusions = settings.getStringArray(CoreProperties.CPD_EXCLUSIONS);
        logExclusions(cpdExclusions, LOG);
        FilePredicates p = fs.predicates();
        List<InputFile> sourceFiles = Lists.newArrayList(fs.inputFiles(p.and(p.hasType(InputFile.Type.MAIN),
                p.hasLanguage(languageKey), p.doesNotMatchPathPatterns(cpdExclusions))));
        if (sourceFiles.isEmpty()) {
            return;
        }
        SonarDuplicationsIndex index = createIndex(project, languageKey, sourceFiles);
        detect(index, context, sourceFiles);
    }

    private SonarDuplicationsIndex createIndex(@Nullable Project project, String language,
            Iterable<InputFile> sourceFiles) {
        final SonarDuplicationsIndex index = indexFactory.create(project, language);

        TokenChunker tokenChunker = JavaTokenProducer.build();
        StatementChunker statementChunker = JavaStatementBuilder.build();
        BlockChunker blockChunker = new BlockChunker(BLOCK_SIZE);

        for (InputFile inputFile : sourceFiles) {
            LOG.debug("Populating index from {}", inputFile);
            String resourceEffectiveKey = ((DefaultInputFile) inputFile).key();

            List<Statement> statements;

            Reader reader = null;
            try {
                reader = new InputStreamReader(new FileInputStream(inputFile.file()), fs.encoding());
                statements = statementChunker.chunk(tokenChunker.chunk(reader));
            } catch (FileNotFoundException e) {
                throw new SonarException("Cannot find file " + inputFile.file(), e);
            } finally {
                IOUtils.closeQuietly(reader);
            }

            List<Block> blocks = blockChunker.chunk(resourceEffectiveKey, statements);
            index.insert(inputFile, blocks);
        }

        return index;
    }

    private void detect(SonarDuplicationsIndex index, org.sonar.api.batch.sensor.SensorContext context,
            List<InputFile> sourceFiles) {
        ExecutorService executorService = Executors.newSingleThreadExecutor();
        try {
            for (InputFile inputFile : sourceFiles) {
                LOG.debug("Detection of duplications for {}", inputFile);
                String resourceEffectiveKey = ((DefaultInputFile) inputFile).key();

                Collection<Block> fileBlocks = index.getByInputFile(inputFile, resourceEffectiveKey);

                List<CloneGroup> clones;
                try {
                    clones = executorService.submit(new Task(index, fileBlocks)).get(TIMEOUT, TimeUnit.SECONDS);
                } catch (TimeoutException e) {
                    clones = null;
                    LOG.warn("Timeout during detection of duplications for " + inputFile, e);
                } catch (InterruptedException e) {
                    throw new SonarException("Fail during detection of duplication for " + inputFile, e);
                } catch (ExecutionException e) {
                    throw new SonarException("Fail during detection of duplication for " + inputFile, e);
                }

                save(context, inputFile, clones);
            }
        } finally {
            executorService.shutdown();
        }
    }

    static class Task implements Callable<List<CloneGroup>> {
        private final CloneIndex index;
        private final Collection<Block> fileBlocks;

        public Task(CloneIndex index, Collection<Block> fileBlocks) {
            this.index = index;
            this.fileBlocks = fileBlocks;
        }

        @Override
        public List<CloneGroup> call() {
            return SuffixTreeCloneDetectionAlgorithm.detect(index, fileBlocks);
        }
    }

    static void save(org.sonar.api.batch.sensor.SensorContext context, InputFile inputFile,
            @Nullable Iterable<CloneGroup> duplications) {
        if (duplications == null || Iterables.isEmpty(duplications)) {
            return;
        }
        computeBlockAndLineCount(context, inputFile, duplications);

        saveDuplications(context, inputFile, duplications);
    }

    private static void saveMeasures(org.sonar.api.batch.sensor.SensorContext context, InputFile inputFile,
            int duplicatedLines, int duplicatedBlocks) {
        // Save
        ((DefaultMeasure<Integer>) context.<Integer>newMeasure().forMetric(CoreMetrics.DUPLICATED_FILES)
                .onFile(inputFile).withValue(1)).setFromCore().save();
        ((DefaultMeasure<Integer>) context.<Integer>newMeasure().forMetric(CoreMetrics.DUPLICATED_LINES)
                .onFile(inputFile).withValue(duplicatedLines)).setFromCore().save();
        ((DefaultMeasure<Integer>) context.<Integer>newMeasure().forMetric(CoreMetrics.DUPLICATED_BLOCKS)
                .onFile(inputFile).withValue(duplicatedBlocks)).setFromCore().save();
    }

    private static void saveDuplications(org.sonar.api.batch.sensor.SensorContext context, InputFile inputFile,
            Iterable<CloneGroup> duplications) {
        int cloneGroupCount = 0;
        for (CloneGroup duplication : duplications) {
            cloneGroupCount++;
            if (cloneGroupCount > MAX_CLONE_GROUP_PER_FILE) {
                LOG.warn("Too many duplication groups on file " + inputFile.relativePath()
                        + ". Keep only the first " + MAX_CLONE_GROUP_PER_FILE + " groups.");
                break;
            }
            NewDuplication builder = context.newDuplication();
            ClonePart originPart = duplication.getOriginPart();
            builder.originBlock(inputFile, originPart.getStartLine(), originPart.getEndLine());
            int clonePartCount = 0;
            for (ClonePart part : duplication.getCloneParts()) {
                if (!part.equals(originPart)) {
                    clonePartCount++;
                    if (clonePartCount > MAX_CLONE_PART_PER_GROUP) {
                        LOG.warn("Too many duplication references on file " + inputFile.relativePath()
                                + " for block at line " + originPart.getStartLine() + ". Keep only the first "
                                + MAX_CLONE_PART_PER_GROUP + " references.");
                        break;
                    }
                    ((DefaultDuplication) builder).isDuplicatedBy(part.getResourceId(), part.getStartLine(),
                            part.getEndLine());
                }
            }
            builder.save();
        }
    }

    private static void computeBlockAndLineCount(org.sonar.api.batch.sensor.SensorContext context,
            InputFile inputFile, Iterable<CloneGroup> duplications) {
        int duplicatedBlocks = 0;
        Set<Integer> duplicatedLines = new HashSet<>();
        for (CloneGroup clone : duplications) {
            ClonePart origin = clone.getOriginPart();
            for (ClonePart part : clone.getCloneParts()) {
                if (part.getResourceId().equals(origin.getResourceId())) {
                    duplicatedBlocks++;
                    for (int duplicatedLine = part.getStartLine(); duplicatedLine < part.getStartLine()
                            + part.getLines(); duplicatedLine++) {
                        duplicatedLines.add(duplicatedLine);
                    }
                }
            }
        }
        saveMeasures(context, inputFile, duplicatedLines.size(), duplicatedBlocks);
    }

}