大厂面试题目数组（从文件中找到重复次数最高的单词）-爱玩科技

忙族 2023-06-23 06:53:25 325

大厂面试题目数组（从文件中找到重复次数最高的单词）/** * 读取文件单词存储到List * @param fileName * @return */ public static List<String> list(String fileName) { List list = new ArrayList<String>(); try (BufferedReader br = new BufferedReader( new InputStreamReader( new DataInputStream( new FileInputStream(fileName))))) { // 单词分隔符为空格 Pattern pattern = Patter

今天给大家分享一道常问的面试题目：从文件中找到重复次数最高的单词。这道题目的解决方案很多，今天就跟大家分享2种解决方案，希望能够帮助大家。

方案一、使用Hashamp和Comparator实现

这个解决方案最核心重要地方就是对Hashmap条目进行排序，因为Map.Entry没有实现Comparable接口，因此我们需要编写自己的自定义Comparator来对条目进行排序。

1. 使用IO流读取文件单词并统计单词重复次数输出到Hashmap

/** * 读取文件单词使用Hashmap存储并统计重复次数 * @param fileName * @return */ public static Map<String Integer> buildCountMap(String fileName) { Map<String Integer> wordsMap = new HashMap<>(); try (BufferedReader br = new BufferedReader( new InputStreamReader( new DataInputStream( new FileInputStream(fileName))))) { // 单词分隔符为空格 Pattern pattern = Pattern.compile("\\s "); String line = null; while ((line = br.readLine()) != null) { line = line.toLowerCase(); String[] words = pattern.split(line); for (String word : words) { if (wordsMap.containsKey(word)) { //存在单词，重复次数 1 wordsMap.put(word (wordsMap.get(word) 1)); } else { //不存在，默认次数为1 wordsMap.put(word 1); } } } } catch (IOException ex) { ex.printStackTrace(); } return wordsMap; }

2、使用Comparator降序排列集合元素

/** * 使用Comparator降序排序集合元素 * @param wordsMap * @return */ public static List<Map.Entry<String Integer>> sort(Map<String Integer> wordsMap) { List<Map.Entry<String Integer>> list = new ArrayList<>(wordsMap.entrySet()); Collections.sort(list new Comparator<Map.Entry<String Integer>>() { @Override public int compare(Map.Entry<String Integer> o1 Map.Entry<String Integer> o2) { return (o2.getValue()).compareTo(o1.getValue()); } }); return list; }

3、测试结果

public static void main(String args[]) { //方案一 Map<String Integer> wordsMap = buildCountMap("C:/demo/sample.txt"); List<Map.Entry<String Integer>> list = sort(wordsMap); System.out.println("List of repeated word from file and their count"); for (Map.Entry<String Integer> entry : list) { System.out.println(entry.getKey() " => " entry.getValue()); } }

输出结果：

大厂面试题目数组（从文件中找到重复次数最高的单词）(1)

方案二、使用List和Stream汇总排序

这个解决方案会读取文本单词到List 重点是使用java8的stream 函数实现文件分类汇总后倒序排列集合元素。

1、读取文件单词存储到List

/** * 读取文件单词存储到List * @param fileName * @return */ public static List<String> list(String fileName) { List list = new ArrayList<String>(); try (BufferedReader br = new BufferedReader( new InputStreamReader( new DataInputStream( new FileInputStream(fileName))))) { // 单词分隔符为空格 Pattern pattern = Pattern.compile("\\s "); String line = null; while ((line = br.readLine()) != null) { line = line.toLowerCase(); String[] words = pattern.split(line); for (String word : words) { list.add(word); } } } catch (IOException ex) { ex.printStackTrace(); } return list; }

2、使用Stream流汇总元素后降序排序

如果你熟悉JAVA8 Stream的话，可以使用stream函数collect group by 以及sorted功能实现。

（1）首先通过group by 统计List元素重复次数并输出到Map

（2）再把map元素遍历使用sorted倒序排列输出到LinkedHashmap就可以实现了

/** * Stream汇总结合后倒序排列存储到LinkedHashMap * @param wordsList */ public static void sort(List<String> wordsList){ //List元素group by统计单词的重复次数输出到Map Map<String Long> map = wordsList.stream().collect(Collectors.groupingBy(Function.identity() Collectors.counting())); //使用Stream.sorted倒序排列map条目到LinkedHashMap Map<String Long> sortMap = new LinkedHashMap<>(); map.entrySet().stream().sorted(Map.Entry.<String Long>comparingByValue().reversed()). forEachOrdered(e -> sortMap.put(e.getKey() e.getValue())); sortMap.forEach((k v)->{ System.out.println("word=" k " count=" v); }); }

3、测试结果

public static void main(String args[]) { //方案二 sort(list("C:/demo/sample.txt")); }

打印测试结果：

大厂面试题目数组（从文件中找到重复次数最高的单词）(2)