1.Json 数据表示方式介绍
这个可以看之前的一个文章里面有说明:Java解析(读取)Json数据
2.C++ Jsoncpp
2.1 Jsoncpp介绍
(1)JsonCpp主要包含三种类型的class:Value Reader Writer;
Json::Value 是jsoncpp 中最基本、最重要的类,用于表示各种类型的对象,jsoncpp 支持的对象类型可见 Json::ValueType 枚举值。
Json::Reader 是用于读取的,说的确切点,是用于将字符串转换为 Json::Value 对象的。
Json::Writer 类是一个纯虚类,并不能直接使用。在此我们使用 Json::Writer 的子类:Json::FastWriter、Json::StyledWriter、Json::StyledStreamWriter。
(2)Jsoncpp中所有对象、类名都在namespace json中,包含json.h即可
2.2 Jsoncpp的下载与编译
下载下来的jsoncpp必须要编译才能使用,在ubuntut上使用如下:
####下载jsoncpp-src-0.5.0.tar.gz######
tar -xvzf jsoncpp-src-0.5.0.tar.gz
cd jsoncpp-src-0.5.0
scons platform=linux-gcc
gcc版本是4.6的,上面的命令执行完后,会在jsoncpp-src-0.5.0/libs/linux-gcc-4.6目录下面生成库文件:
(1)libjson_linux-gcc-4.6_libmt.a
(2)libjson_linux-gcc-4.6_libmt.so
之后,将动态链接库libjson_linux-gcc-4.6_libmt.so,添加到搜索路径中,参照:linux找不到动态链接库 .so文件的解决方法
3.Jsoncpp使用代码示例
3.1 程序解析json数据
解析下面的文件JsonText,文件如下:
"name": "json",
"array": [
"123",
"456",
"789"
]
}
代码(c.cpp):
2 #include <string>
3 #include <stdlib.h>
4 #include <iostream>
5 #include <fstream>
6 using namespace std;
7 int main()
8 {
9 ifstream is;
10 is.open ("JsonText", std::ios::binary );
11 Json::Reader reader;
12 Json::Value root;
13 if(reader.parse(is,root)) ///root保存整个Json对象的value
14 {
15 if(!root["name"].isNull())
16 {
17 cout<<root["name"].asString()<<endl; ///读取元素
18 Json::Value arrayObj = root["array"];
19 for(int i=0 ; i< arrayObj.size() ;i++)
20 {
21 cout<<arrayObj.asString()<<endl;
22 }
23 }
24 }
25 return 0;
26 }
编译、链接、执行:
g++ c.cpp -I ./include/ -L./libs/linux-gcc-4.6/ -ljson_linux-gcc-4.6_libmt -o C
./C
执行结果:
json
123
456
789
3.2 程序生成json数据
代码:
2 #include <string>
3 #include "json/json.h"
4
5 int main(void)
6 {
7 Json::Value root;
8 Json::Value arrayObj;
9 Json::Value item;
10
11 for (int i = 0; i < 2; i ++)
12 {
13 item["key"] = i;
14 //arrayObj.append(item); ///给arrayObj中添加元素(arrayObj变为数组)
15 arrayObj.append(i); ///给arrayObj中添加元素(arrayObj变为数组)
16 }
数据挖掘算法之k-means算法 - 潇一 阅读原文»
k-means算法可以说是数据挖掘中十大经典算法之一了,属于无监督的学习。该算法由此衍生出了很多类k-means算法,比如k中心点等等,在数据挖掘领域,很多地方都会用到该算法,他能够把相似的一类很好的聚在一起。一类指的是,他们之间的相似度较高,计算相似度的常用度量有欧氏距离、余弦定理等。本算法采用的是欧式距离度量。这个对理解k-means算法不会造成任何实质性的影响。
为了更好的说明k-means算法是把属于一类的对象聚成一个簇的,下面贴两张图,一张是100个数据对象是,K=2的情况【图1】。
另外一张是1000个数据对象,k=3的情况,希望大家看完图能够加深对K-means算法的理解。
[图1 objectNum=100 k=2]
[图2 objectNum=1000 k=3]
k-means算法的中心思想其实就是迭代,通过不断的迭代,使聚类效果达到局部最优,为什么我们说局部最优呢?因为K-means算法的效果的优劣性和最初选取的中心点是有莫大关系的,我们只能在初始中心点的基础上达到局部最优解。
k-means算法的过程如下:
#include<fstream>
#include<vector>
#include<random>
#include<time.h>
#include<string.h>
using namespace std;
const int maxNum=0x1<<30;
const int repeatMax=100;//控制迭代的上限,这里主要从效率的角度来考虑。一般来说迭代50--100次就能达到很好的效果
const int AttributeCount=2;//数据属性维度.
const int ClusterK=8;//聚成的簇的数量
typedef double AttributeType;
struct Object{//数据项的数据结构
AttributeType attribute[AttributeCount];
};
vector<Object> allObj;//保存所有的数据
Object cluster[1000][ClusterK];//各个簇的数据项,这里假定每个簇的最大量为1000了,可以写成vector的数据结构,
Object oldcenter[ClusterK];//旧的各个中心点
int oldCluObjNum[ClusterK];//旧的各个簇有多少数据量
Object center[ClusterK];//对比旧的中心点
int CluObjNum[ClusterK];//对比旧的各簇的数据量
void getAllobject(ifstream &ifs);//加载所有数据
void kmeans(ifstream &ins);//算法
void produceData(string fileName,int maxNum,int objectNum);//随机产生数据,fileName文件名,maxNum数据的最大数,objectNum数据个数
int cloestCluster(Object obj);//返回当前数据项与哪个簇最近
void initCenter();//初始化各中心点
void updateCluster(int cluK,Object obj);//更新簇结构
bool isChange();//判断迭代之后中心点是否改变,若没有改变可以迭代结束了,得到局部最优解
void copyCenter();//复制到旧的中
void computeCenter();//重新计算中心点
AttributeType Distance(Object obj,Object obj2);//计算两个点之间的距离
int main(){
//produceData("data2.txt",100,50);
ifstream ifs;
ifs.open("data2.txt");
kmeans(ifs);
ifs.close();
system("pause");
}
void kmeans(ifstream &ins){
getAllobject(ins);
initCenter();
for(int i=0;i<ClusterK;i++){
center=allObj;
CluObjNum=0;
}
int repeat=0;
while(isChange()&&repeat<repeatMax){//阅读更多内容
没有评论:
发表评论