搜狗号码通能打电话吗?

时间:2024-12-10 12:53 人气:0 编辑:招聘街

一、搜狗号码通能打电话吗?

1.不能打电话,不用花钱。类似于一个来电防火墙。

2.搜狗号码通是“搜狗”旗下一款广受人们群众喜爱的专业级号码工具类软件,用不到可以删除,不会影响系统运行。

3.它让沟通更快更聪明,首创对骚扰号码用户进行分类“标记”,陌生来电自动识别,机构来源可靠认证;它让预约更轻更快捷,“超级电话本”功能目前已经成为用户衣食住行的“生活助手”;它的拦截更准更安全,让诈骗,中介,推销等骚扰号码和垃圾短信无处遁形。

二、媒体记者电话面试题

新媒体记者电话面试题

媒体行业一直是一个极具竞争性的领域,而成为一名优秀的新媒体记者更是需要具备专业的技能和素养。当您参加新媒体记者电话面试时,可能会遇到各种各样的问题。下面是一些常见的新媒体记者电话面试题供您参考:

即刻反应:

1. 您认为在快节奏的新闻行业中,即刻反应的能力有多重要?您是如何处理突发新闻事件和紧急报道的?

创作能力:

2. 请分享一次您觉得自豪的新闻报道经历,并阐述您在创作过程中的思考和技巧。

挖掘新闻价值:

3. 您如何发现并确定一个新闻事件的价值?在进行独立报道时,您通常会进行怎样的调查和研究?

沟通与团队协作:4. 在团队合作中,您是如何与其他记者、编辑以及其他部门进行高效沟通的?是否有协作经验令您难忘的事例?

新媒体技术应用:

5. 您对当前新媒体技术的发展有哪些看法?您在新媒体报道中常用的工具和平台有哪些?

创新与突破:

6. 请分享一次您在新闻报道中进行创新和突破的经历,这种改变带来了怎样的影响和成就感?

严谨与真实性:

7. 您在报道中如何保持信息的准确性和真实性?是否遇到过挑战或误解,您是如何应对的?

职业规划与目标:

8. 您对自己未来在新闻行业的职业规划是怎样的?您希望未来在什么方面取得突破和进步?

以上问题旨在帮助面试官更全面地了解您作为一名新媒体记者的能力和潜力。精心准备这些问题的答案,展现出您的专业知识、同理心和沟通技巧,将有助于让您在新媒体记者电话面试中脱颖而出。

祝您面试顺利,早日实现新媒体记者的梦想!

三、搜狗输入法怎么开启电话【权限。】?

进入设置选应用权限,选搜狗输入法,里面有各种权限可以选择开启关闭。

四、媒体记者电话面试题目

媒体记者电话面试题目

介绍

当您在寻求媒体记者职位时,可能会遇到电话面试这一关。电话面试是招聘过程中非常重要的一步,它可以帮助雇主更好地了解您的能力、背景和动机。为了帮助您顺利通过媒体记者电话面试,本文将介绍一些常见的题目和答题技巧。

面试题目

在媒体记者电话面试中,面试官可能会问及以下问题:

  • 1. 请介绍一下您的专业背景和工作经验。
  • 2. 您是如何获取新闻线索和进行调查报道的?
  • 3. 如何看待当今媒体行业的挑战和机遇?
  • 4. 请分享您最引以为傲的新闻报道经历。
  • 5. 在处理新闻事件时,您是如何确保报道的客观性和真实性的?
  • 6. 您认为一个成功的媒体记者应具备哪些素质?
  • 7. 如何应对新闻报道中的道德困境?
  • 8. 请描述一次您与团队合作完成新闻报道的经历。
  • 9. 您对媒体未来发展有哪些看法和预测?
  • 10. 您是如何处理压力和工作中的挑战的?

答题技巧

在回答以上问题时,有一些技巧和注意事项可能会帮助您顺利通过媒体记者电话面试:

  • 1. 准备充分:提前准备回答常见问题,确保对自己的工作经验和能力有清晰的认识。
  • 2. 结构清晰:回答问题时要有逻辑性,清晰地表达自己的观点和经历。
  • 3. 举例说明:在描述经历时,可以适当举例说明,让回答更具体生动。
  • 4. 诚实坦诚:回答问题要诚实,不需要刻意说好听的话,展示真实的自我。
  • 5. 自信表达:表达时要保持自信,展现出您对媒体行业的热爱和专业素养。
  • 6. 发问机会:在面试结束前,可以提问面试官关于工作内容、团队氛围等方面的问题。

总结

媒体记者电话面试是展示自己能力和素质的重要机会,通过充分准备和自信表达,您可以给面试官留下深刻的印象。希望本文介绍的面试题目和答题技巧能帮助您在媒体记者电话面试中取得成功,顺利迈向理想职业道路。

五、搜狗薰衣草

搜狗薰衣草:睡眠和放松的绝佳良草

搜狗薰衣草,也被称为法国薰衣草或广藿香,是一种被广泛用于改善睡眠和放松身心的草本植物。它的美丽花朵和令人陶醉的香气吸引着无数的人们。除了它的美丽外表,搜狗薰衣草还有许多令人惊叹的益处。

1. 促进睡眠

研究表明,搜狗薰衣草具有镇静和放松的作用,能够帮助改善睡眠质量。它能够减轻焦虑和压力,改善睡眠障碍,让您享受更好的睡眠。搜狗薰衣草可通过它的芳香气味和接触皮肤而发挥作用,您可以将其置于枕头下方,或使用薰衣草精油进行按摩。

2. 缓解压力和焦虑

现代生活中,我们常常面临压力和焦虑。搜狗薰衣草被认为是一种自然的抗焦虑剂,能够缓解紧张情绪,提高心理健康。研究发现,搜狗薰衣草能够降低神经系统的兴奋性,减轻焦虑症状,帮助人们保持平静和放松。

3. 提升心情

搜狗薰衣草的香气被认为具有抗抑郁的效果,能够提升心情,减轻情绪波动。它能够促进生理上的放松并改善睡眠质量,从而改善精神状态。将几滴搜狗薰衣草精油添加到温水中,泡澡时享受它的芳香,可以帮助您放松身心,减轻压力。

4. 护肤与美容

除了对心理健康的益处外,搜狗薰衣草还对皮肤具有积极的影响。它被广泛用于护肤和美容产品中,因为其具有抗炎和抗氧化的特性。搜狗薰衣草可以减少皮肤炎症,舒缓敏感肌肤,促进伤口愈合,并使皮肤保持年轻和健康。

5. 驱虫效果

搜狗薰衣草的香气对许多昆虫具有驱赶作用。它被广泛应用于天然驱虫和防蚊产品中。您可以在夏季露营或户外活动中使用搜狗薰衣草精油来保护自己免受蚊虫叮咬的困扰。

结论

搜狗薰衣草是一种美丽的草本植物,拥有众多的益处。它能够改善睡眠质量、减轻压力和焦虑、提升心情、护肤与美容,并具有驱虫效果。搜狗薰衣草的使用方式多种多样,您可以将其置于枕头下方、按摩薰衣草精油,或使用护肤和美容产品。无论是在家中还是户外,搜狗薰衣草都是您获得放松和享受的完美选择。

六、搜狗 智能

搜狗智能:中文搜索引擎的最新发展

近年来,搜狗公司在智能搜索领域取得了巨大突破,推动了中文搜索引擎技术的进步。在人工智能和大数据技术的支持下,搜狗智能搜索不断优化用户体验,为用户提供更加精准、便捷的搜索服务。

智能搜索技术的核心

搜狗智能搜索的核心技术包括自然语言处理、机器学习和深度学习。通过不断优化算法,智能搜索能够理解用户的搜索意图,提供与用户需求最匹配的搜索结果。此外,搜狗还利用大数据分析用户行为,进一步提升搜索结果的质量和准确性。

智能搜索的应用场景

智能搜索技术已经在多个领域得到应用,例如语音搜索、图像识别和自然语言交互。通过与智能设备的结合,搜狗智能搜索实现了更加智能化的搜索体验,越来越多的用户选择使用智能搜索来获取信息。

智能搜索的优势

与传统搜索引擎相比,智能搜索具有更高的智能化程度和个性化定制能力。通过分析用户的行为和偏好,智能搜索能够为用户提供更加个性化的搜索结果,节约用户的时间和精力。

智能搜索的未来发展

随着人工智能技术的不断发展,智能搜索在未来将会实现更加智能化和智能化的发展。搜狗作为智能搜索领域的领导者,将继续投入更多的资源和精力,推动智能搜索技术向前发展。

总的来说,搜狗智能搜索作为中文搜索引擎的先行者,不仅提升了用户的搜索体验,还为中文搜索引擎的发展树立了典范。在未来的发展中,搜狗还将不断创新,推动智能搜索技术的更加广泛应用。

七、分析搜狗

今天我们将分析搜狗,这是中国最著名的互联网公司之一。搜狗成立于2004年,总部位于北京。作为一家知名的搜索引擎提供商,搜狗在搜索技术和人工智能领域取得了显著的成就。让我们深入了解搜狗的起源、产品和未来发展。

搜狗的起源

搜狗是由王小川于2003年创办的。王小川是中国计算机界的知名人物,曾任中国科学院计算技术研究所副研究员。他带领团队创造了搜狗这一搜索引擎,引起了广泛的关注。

搜狗最初目标是提供一种聪明、高效的搜索方式,为用户提供更精准的搜索结果。搜狗以其独特的中文搜索技术和语义分析能力迅速脱颖而出,成为中国用户最喜爱的搜索引擎之一。

搜狗的产品和服务

除了搜索引擎,搜狗还开发和推出了一系列广受欢迎的产品和服务。其中包括:

  • 搜狗输入法:搜狗输入法是中国最受欢迎的输入法之一。它具有智能纠错、词库扩展和个性化定制等功能,为用户提供更好的输入体验。
  • 搜狗浏览器:搜狗浏览器是一款以速度和安全性为特点的浏览器。它提供快速的网页加载速度和强大的广告拦截功能。
  • 搜狗翻译:搜狗翻译是一款方便实用的在线翻译工具。它支持中英文互译以及多种其他语言的翻译。
  • 搜狗输入法手机版:搜狗输入法手机版在移动设备上延续了搜狗输入法的优势。它为用户提供更快速、更智能的输入体验。

通过这些产品和服务,搜狗满足了用户在搜索、输入和翻译方面的需求,成为中国互联网行业的重要参与者。

搜狗的搜索技术和人工智能

搜狗在搜索技术和人工智能领域一直保持领先地位。其拥有强大的中文语义分析技术,能够根据用户的搜索意图提供更准确的搜索结果。

搜狗搜索还广泛应用了大数据和机器学习技术。通过分析海量的用户数据和网页内容,搜狗能够不断改进其搜索算法,提供更好的搜索体验。

搜狗还在人工智能领域做出了重要贡献。他们开发了智能对话机器人,并将其应用于各种场景,如智能客服和智能助手。

搜狗的未来发展

搜狗作为中国互联网行业的巨头,其未来发展仍然充满着巨大的潜力和机遇。

首先,搜狗将继续加强其搜索技术和人工智能能力。他们将不断改进搜索算法,提供更准确、个性化的搜索结果。同时,搜狗还将继续推动人工智能技术的创新和应用,为用户提供更智能化的产品和服务。

其次,搜狗将继续扩大其产品和服务的覆盖范围。他们将进一步完善搜狗输入法、搜狗浏览器和搜狗翻译等产品,满足用户在不同场景下的需求。同时,他们还将加强移动互联网领域的布局,开发更多适用于手机和平板电脑的产品。

最后,搜狗将继续加强与合作伙伴的合作,拓展业务和市场。他们将与其他互联网公司、内容提供商和手机厂商等合作,共同推动中国互联网行业的发展。

总之,搜狗作为中国互联网行业的领军企业,凭借其先进的搜索技术和人工智能能力,以及出色的产品和服务,势必在未来取得更大的成就。

八、centos 搜狗

CentOS是一种流行的Linux发行版,广泛用于服务器和个人电脑。它是一款免费的操作系统,由社区支持,并提供稳定可靠的性能。对于许多用户来说,CentOS是他们首选的操作系统之一。

什么是CentOS?

CentOS是基于Red Hat Enterprise Linux(RHEL)源代码构建的企业级操作系统。它的名称来自于“Community ENTerprise Operating System”的缩写。CentOS专注于提供稳定、安全且可靠的操作系统,以满足企业和个人用户的需求。

与许多其他Linux发行版相比,CentOS的一个显着特点是其长期支持(LTS)版本。这意味着用户可以放心地依赖CentOS提供的长期维护和更新,而无需担心频繁的系统更改或版本升级。

CentOS的优点

作为一种流行的Linux发行版,CentOS拥有许多优点,使其成为许多用户的首选。以下是一些CentOS的主要优点:

  • 稳定性: CentOS以其稳定性而闻名。由于其基于RHEL源代码,CentOS受益于红帽公司广泛的测试和验证过程,确保系统的稳定性和可靠性。
  • 安全性: CentOS提供了强大的安全性功能,包括持续的安全更新和漏洞修复。这使得CentOS成为许多企业和组织的首选,尤其是对于需要安全性能和保护机制的用户。
  • 社区支持: CentOS得到了一个活跃的用户社区的支持。用户可以在社区论坛和邮件列表中获取帮助、交流经验和解决问题,使其在使用和维护CentOS系统时更加便利。

CentOS和搜狗的关系

虽然CentOS是一种主要用于服务器的操作系统,但用户可以根据自己的需求进行定制和配置,使其适用于各种用途,包括桌面工作站和开发环境。在一些特定场景中,用户可能需要安装和使用某些中国特定的应用程序或服务,如搜狗输入法。

搜狗输入法是一款广受用户喜爱的输入法工具,具有强大的中文输入功能和智能纠错能力,为用户提供了更加便捷和高效的输入体验。许多用户习惯于在其Linux系统上安装和使用搜狗输入法,以满足其中文输入需求。

与CentOS兼容的搜狗输入法版本可供用户下载和安装,使用户能够在CentOS系统上享受到搜狗输入法提供的便利和功能。在安装搜狗输入法时,用户需要确保与CentOS系统的兼容性,并遵循正确的安装步骤,以确保输入法可以正常工作并集成到系统中。

结论

CentOS作为一种流行的Linux发行版,提供了稳定、安全且可靠的操作系统环境,满足了用户的各种需求。与之兼容的诸多应用程序和服务,如搜狗输入法,使用户能够在CentOS系统上获得更加丰富和完善的体验。无论是作为服务器操作系统还是个人电脑的操作系统,CentOS都展现了其在性能、稳定性和可靠性方面的优势,为用户提供了优质的使用体验。

九、搜狗糖猫儿童电话手表的防水性好不好?

搜狗糖猫儿童电话手表的防水性很好!已经通过国际上较为权威的防尘防水等级IP64测试,如果在雨天或者洗手时佩戴是没有问题!

十、mahout面试题?

之前看了Mahout官方示例 20news 的调用实现;于是想根据示例的流程实现其他例子。网上看到了一个关于天气适不适合打羽毛球的例子。

训练数据:

Day Outlook Temperature Humidity Wind PlayTennis

D1 Sunny Hot High Weak No

D2 Sunny Hot High Strong No

D3 Overcast Hot High Weak Yes

D4 Rain Mild High Weak Yes

D5 Rain Cool Normal Weak Yes

D6 Rain Cool Normal Strong No

D7 Overcast Cool Normal Strong Yes

D8 Sunny Mild High Weak No

D9 Sunny Cool Normal Weak Yes

D10 Rain Mild Normal Weak Yes

D11 Sunny Mild Normal Strong Yes

D12 Overcast Mild High Strong Yes

D13 Overcast Hot Normal Weak Yes

D14 Rain Mild High Strong No

检测数据:

sunny,hot,high,weak

结果:

Yes=》 0.007039

No=》 0.027418

于是使用Java代码调用Mahout的工具类实现分类。

基本思想:

1. 构造分类数据。

2. 使用Mahout工具类进行训练,得到训练模型。

3。将要检测数据转换成vector数据。

4. 分类器对vector数据进行分类。

接下来贴下我的代码实现=》

1. 构造分类数据:

在hdfs主要创建一个文件夹路径 /zhoujainfeng/playtennis/input 并将分类文件夹 no 和 yes 的数据传到hdfs上面。

数据文件格式,如D1文件内容: Sunny Hot High Weak

2. 使用Mahout工具类进行训练,得到训练模型。

3。将要检测数据转换成vector数据。

4. 分类器对vector数据进行分类。

这三步,代码我就一次全贴出来;主要是两个类 PlayTennis1 和 BayesCheckData = =》

package myTesting.bayes;

import org.apache.hadoop.conf.Configuration;

import org.apache.hadoop.fs.FileSystem;

import org.apache.hadoop.fs.Path;

import org.apache.hadoop.util.ToolRunner;

import org.apache.mahout.classifier.naivebayes.training.TrainNaiveBayesJob;

import org.apache.mahout.text.SequenceFilesFromDirectory;

import org.apache.mahout.vectorizer.SparseVectorsFromSequenceFiles;

public class PlayTennis1 {

private static final String WORK_DIR = "hdfs://192.168.9.72:9000/zhoujianfeng/playtennis";

/*

* 测试代码

*/

public static void main(String[] args) {

//将训练数据转换成 vector数据

makeTrainVector();

//产生训练模型

makeModel(false);

//测试检测数据

BayesCheckData.printResult();

}

public static void makeCheckVector(){

//将测试数据转换成序列化文件

try {

Configuration conf = new Configuration();

conf.addResource(new Path("/usr/local/hadoop/conf/core-site.xml"));

String input = WORK_DIR+Path.SEPARATOR+"testinput";

String output = WORK_DIR+Path.SEPARATOR+"tennis-test-seq";

Path in = new Path(input);

Path out = new Path(output);

FileSystem fs = FileSystem.get(conf);

if(fs.exists(in)){

if(fs.exists(out)){

//boolean参数是,是否递归删除的意思

fs.delete(out, true);

}

SequenceFilesFromDirectory sffd = new SequenceFilesFromDirectory();

String[] params = new String[]{"-i",input,"-o",output,"-ow"};

ToolRunner.run(sffd, params);

}

} catch (Exception e) {

// TODO Auto-generated catch block

e.printStackTrace();

System.out.println("文件序列化失败!");

System.exit(1);

}

//将序列化文件转换成向量文件

try {

Configuration conf = new Configuration();

conf.addResource(new Path("/usr/local/hadoop/conf/core-site.xml"));

String input = WORK_DIR+Path.SEPARATOR+"tennis-test-seq";

String output = WORK_DIR+Path.SEPARATOR+"tennis-test-vectors";

Path in = new Path(input);

Path out = new Path(output);

FileSystem fs = FileSystem.get(conf);

if(fs.exists(in)){

if(fs.exists(out)){

//boolean参数是,是否递归删除的意思

fs.delete(out, true);

}

SparseVectorsFromSequenceFiles svfsf = new SparseVectorsFromSequenceFiles();

String[] params = new String[]{"-i",input,"-o",output,"-lnorm","-nv","-wt","tfidf"};

ToolRunner.run(svfsf, params);

}

} catch (Exception e) {

// TODO Auto-generated catch block

e.printStackTrace();

System.out.println("序列化文件转换成向量失败!");

System.out.println(2);

}

}

public static void makeTrainVector(){

//将测试数据转换成序列化文件

try {

Configuration conf = new Configuration();

conf.addResource(new Path("/usr/local/hadoop/conf/core-site.xml"));

String input = WORK_DIR+Path.SEPARATOR+"input";

String output = WORK_DIR+Path.SEPARATOR+"tennis-seq";

Path in = new Path(input);

Path out = new Path(output);

FileSystem fs = FileSystem.get(conf);

if(fs.exists(in)){

if(fs.exists(out)){

//boolean参数是,是否递归删除的意思

fs.delete(out, true);

}

SequenceFilesFromDirectory sffd = new SequenceFilesFromDirectory();

String[] params = new String[]{"-i",input,"-o",output,"-ow"};

ToolRunner.run(sffd, params);

}

} catch (Exception e) {

// TODO Auto-generated catch block

e.printStackTrace();

System.out.println("文件序列化失败!");

System.exit(1);

}

//将序列化文件转换成向量文件

try {

Configuration conf = new Configuration();

conf.addResource(new Path("/usr/local/hadoop/conf/core-site.xml"));

String input = WORK_DIR+Path.SEPARATOR+"tennis-seq";

String output = WORK_DIR+Path.SEPARATOR+"tennis-vectors";

Path in = new Path(input);

Path out = new Path(output);

FileSystem fs = FileSystem.get(conf);

if(fs.exists(in)){

if(fs.exists(out)){

//boolean参数是,是否递归删除的意思

fs.delete(out, true);

}

SparseVectorsFromSequenceFiles svfsf = new SparseVectorsFromSequenceFiles();

String[] params = new String[]{"-i",input,"-o",output,"-lnorm","-nv","-wt","tfidf"};

ToolRunner.run(svfsf, params);

}

} catch (Exception e) {

// TODO Auto-generated catch block

e.printStackTrace();

System.out.println("序列化文件转换成向量失败!");

System.out.println(2);

}

}

public static void makeModel(boolean completelyNB){

try {

Configuration conf = new Configuration();

conf.addResource(new Path("/usr/local/hadoop/conf/core-site.xml"));

String input = WORK_DIR+Path.SEPARATOR+"tennis-vectors"+Path.SEPARATOR+"tfidf-vectors";

String model = WORK_DIR+Path.SEPARATOR+"model";

String labelindex = WORK_DIR+Path.SEPARATOR+"labelindex";

Path in = new Path(input);

Path out = new Path(model);

Path label = new Path(labelindex);

FileSystem fs = FileSystem.get(conf);

if(fs.exists(in)){

if(fs.exists(out)){

//boolean参数是,是否递归删除的意思

fs.delete(out, true);

}

if(fs.exists(label)){

//boolean参数是,是否递归删除的意思

fs.delete(label, true);

}

TrainNaiveBayesJob tnbj = new TrainNaiveBayesJob();

String[] params =null;

if(completelyNB){

params = new String[]{"-i",input,"-el","-o",model,"-li",labelindex,"-ow","-c"};

}else{

params = new String[]{"-i",input,"-el","-o",model,"-li",labelindex,"-ow"};

}

ToolRunner.run(tnbj, params);

}

} catch (Exception e) {

// TODO Auto-generated catch block

e.printStackTrace();

System.out.println("生成训练模型失败!");

System.exit(3);

}

}

}

package myTesting.bayes;

import java.io.IOException;

import java.util.HashMap;

import java.util.Map;

import org.apache.commons.lang.StringUtils;

import org.apache.hadoop.conf.Configuration;

import org.apache.hadoop.fs.Path;

import org.apache.hadoop.fs.PathFilter;

import org.apache.hadoop.io.IntWritable;

import org.apache.hadoop.io.LongWritable;

import org.apache.hadoop.io.Text;

import org.apache.mahout.classifier.naivebayes.BayesUtils;

import org.apache.mahout.classifier.naivebayes.NaiveBayesModel;

import org.apache.mahout.classifier.naivebayes.StandardNaiveBayesClassifier;

import org.apache.mahout.common.Pair;

import org.apache.mahout.common.iterator.sequencefile.PathType;

import org.apache.mahout.common.iterator.sequencefile.SequenceFileDirIterable;

import org.apache.mahout.math.RandomAccessSparseVector;

import org.apache.mahout.math.Vector;

import org.apache.mahout.math.Vector.Element;

import org.apache.mahout.vectorizer.TFIDF;

import com.google.common.collect.ConcurrentHashMultiset;

import com.google.common.collect.Multiset;

public class BayesCheckData {

private static StandardNaiveBayesClassifier classifier;

private static Map<String, Integer> dictionary;

private static Map<Integer, Long> documentFrequency;

private static Map<Integer, String> labelIndex;

public void init(Configuration conf){

try {

String modelPath = "/zhoujianfeng/playtennis/model";

String dictionaryPath = "/zhoujianfeng/playtennis/tennis-vectors/dictionary.file-0";

String documentFrequencyPath = "/zhoujianfeng/playtennis/tennis-vectors/df-count";

String labelIndexPath = "/zhoujianfeng/playtennis/labelindex";

dictionary = readDictionnary(conf, new Path(dictionaryPath));

documentFrequency = readDocumentFrequency(conf, new Path(documentFrequencyPath));

labelIndex = BayesUtils.readLabelIndex(conf, new Path(labelIndexPath));

NaiveBayesModel model = NaiveBayesModel.materialize(new Path(modelPath), conf);

classifier = new StandardNaiveBayesClassifier(model);

} catch (IOException e) {

// TODO Auto-generated catch block

e.printStackTrace();

System.out.println("检测数据构造成vectors初始化时报错。。。。");

System.exit(4);

}

}

/**

* 加载字典文件,Key: TermValue; Value:TermID

* @param conf

* @param dictionnaryDir

* @return

*/

private static Map<String, Integer> readDictionnary(Configuration conf, Path dictionnaryDir) {

Map<String, Integer> dictionnary = new HashMap<String, Integer>();

PathFilter filter = new PathFilter() {

@Override

public boolean accept(Path path) {

String name = path.getName();

return name.startsWith("dictionary.file");

}

};

for (Pair<Text, IntWritable> pair : new SequenceFileDirIterable<Text, IntWritable>(dictionnaryDir, PathType.LIST, filter, conf)) {

dictionnary.put(pair.getFirst().toString(), pair.getSecond().get());

}

return dictionnary;

}

/**

* 加载df-count目录下TermDoc频率文件,Key: TermID; Value:DocFreq

* @param conf

* @param dictionnaryDir

* @return

*/

private static Map<Integer, Long> readDocumentFrequency(Configuration conf, Path documentFrequencyDir) {

Map<Integer, Long> documentFrequency = new HashMap<Integer, Long>();

PathFilter filter = new PathFilter() {

@Override

public boolean accept(Path path) {

return path.getName().startsWith("part-r");

}

};

for (Pair<IntWritable, LongWritable> pair : new SequenceFileDirIterable<IntWritable, LongWritable>(documentFrequencyDir, PathType.LIST, filter, conf)) {

documentFrequency.put(pair.getFirst().get(), pair.getSecond().get());

}

return documentFrequency;

}

public static String getCheckResult(){

Configuration conf = new Configuration();

conf.addResource(new Path("/usr/local/hadoop/conf/core-site.xml"));

String classify = "NaN";

BayesCheckData cdv = new BayesCheckData();

cdv.init(conf);

System.out.println("init done...............");

Vector vector = new RandomAccessSparseVector(10000);

TFIDF tfidf = new TFIDF();

//sunny,hot,high,weak

Multiset<String> words = ConcurrentHashMultiset.create();

words.add("sunny",1);

words.add("hot",1);

words.add("high",1);

words.add("weak",1);

int documentCount = documentFrequency.get(-1).intValue(); // key=-1时表示总文档数

for (Multiset.Entry<String> entry : words.entrySet()) {

String word = entry.getElement();

int count = entry.getCount();

Integer wordId = dictionary.get(word); // 需要从dictionary.file-0文件(tf-vector)下得到wordID,

if (StringUtils.isEmpty(wordId.toString())){

continue;

}

if (documentFrequency.get(wordId) == null){

continue;

}

Long freq = documentFrequency.get(wordId);

double tfIdfValue = tfidf.calculate(count, freq.intValue(), 1, documentCount);

vector.setQuick(wordId, tfIdfValue);

}

// 利用贝叶斯算法开始分类,并提取得分最好的分类label

Vector resultVector = classifier.classifyFull(vector);

double bestScore = -Double.MAX_VALUE;

int bestCategoryId = -1;

for(Element element: resultVector.all()) {

int categoryId = element.index();

double score = element.get();

System.out.println("categoryId:"+categoryId+" score:"+score);

if (score > bestScore) {

bestScore = score;

bestCategoryId = categoryId;

}

}

classify = labelIndex.get(bestCategoryId)+"(categoryId="+bestCategoryId+")";

return classify;

}

public static void printResult(){

System.out.println("检测所属类别是:"+getCheckResult());

}

}

相关资讯
热门频道

Copyright © 2024 招聘街 滇ICP备2024020316号-38