详解Java实现的k

网友投稿 336 2023-02-27


详解Java实现的k

需求

对mysql数据库中某个表的某个字段执行k-means算法,将处理后的数据写入新表中。

源码及驱动

kmeans_jb51.rar

源码

import java.sql.*;

import java.util.*;

/**

* @author tianshl

* @version 2018/1/13 上午11:13

*/

public class Kmeans {

// 源数据

private List origins = new ArrayList<>();

// 分组数据

private Map> grouped;

// 初始质心列表

private List cores;

// 数据源

private String tableName;

private String colName;

/**

* 构造方法

*

* @param tableName 源数据表名称

* @param colName 源数据列名称

* @param cores 质心列表

*/

private Kmeans(String tableName, String colName,List cores){

this.cores = cores;

this.tableName = tableName;

this.colName = colName;

}

/**

* 重新计算质心

*

* @return 新的质心列表

*/

private List newCores(){

List newCores = new ArrayList<>();

for(List v: grouped.values()){

newCores.add(v.stream().reduce(0, (sum, num) -> sum + num) / (v.size() + 0.0));

}

Collections.sort(newCores);

return newCores;

}

/**

* 判断是否结束

*

* @return bool

*/

private Boolean isOver(){

List _cores = newCores();

for(int i=0, len=cores.size()http://; i

if(!cores.get(i).toString().equals(_cores.get(i).toString())){

// 使用新质心

cores = _cores;

return false;

}

}

return true;

}

/**

* 数据分组

*/

private void setGrouped(){

grouped = new HashMap<>();

Double core;

for (Integer origin: origins) {

core = getCore(origin);

if (!grouped.containsKey(core)) {

grouped.put(core, new ArrayList<>());

}

grouhttp://ped.get(core).add(origin);

}

}

/**

* 选择质心

*

* @param num 要分组的数据

* @return 质心

*/

private Double getCore(Integer num){

// 差 列表

List diffs = new ArrayList<>();

// 计算差

for(Double core: cores){

diffs.add(Math.abs(num - core));

}

// 最小差 -> 索引 -> 对应的质心

return cores.get(diffs.indexOf(Collections.min(diffs)));

}

/**

* 建立数据库连接

* @return conhttp://nection

*/

private Connection getConn(){

try {

// URL指向要访问的数据库名mydata

String url = "jdbc:mysql://localhost:3306/data_analysis_dev";

// MySQL配置时的用户名

String user = "root";

// MySQL配置时的密码

String password = "root";

// 加载驱动

Class.forName("com.mysql.jdbc.Driver");

//声明Connection对象

Connection conn = DriverManager.getConnection(url, user, password);

if(conn.isClosed()){

System.out.println("连接数据库失败!");

return null;

}

System.out.println("连接数据库成功!");

return conn;

} catch (Exception e) {

System.out.println("连接数据库失败!");

e.printStackTrace();

}

return null;

}

/**

* 关闭数据库连接

*

* @param conn 连接

*/

private void close(Connection conn){

try {

if(conn != null && !conn.isClosed()) conn.close();

} catch (Exception e){

e.printStackTrace();

}

}

/*VxeGLPgqdr*

* 获取源数据

*/

private void getOrigins(){

Connection conn = null;

try {

conn = getConn();

if(conn == null) return;

Statement statement = conn.createStatement();

ResultSet rs = statement.executeQuery(String.format("select %s from %s", colName, tableName));

while(rs.next()){

origins.add(rs.getInt(1));

}

conn.close();

} catch (Exception e){

e.printStackTrace();

} finally {

close(conn);

}

}

/**

* 向新表中写数据

*/

private void write(){

Connection conn = null;

try {

conn = getConn();

if(conn == null) return;

// 创建表

Statement statement = conn.createStatement();

// 删除旧数据表

statement.execute("DROP TABLE IF EXISTS k_means; ");

// 创建新表

statement.execute("CREATE TABLE IF NOT EXISTS k_means(`core` DECIMAL(11, 7), `col` INTEGER(11));");

// 禁止自动提交

conn.setAutoCommit(false);

PreparedStatement ps = conn.prepareStatement("INSERT INTO k_means VALUES (?, ?)");

for(Map.Entry> entry: grouped.entrySet()){

Double core = entry.getKey();

for(Integer value: entry.getValue()){

ps.setDouble(1, core);

ps.setInt(2, value);

ps.addBatch();

}

}

// 批量执行

ps.executeBatch();

// 提交事务

conn.commit();

// 关闭连接

conn.close();

} catch (Exception e){

e.printStackTrace();

} finally {

close(conn);

}

}

/**

* 处理数据

*/

private void run(){

System.out.println("获取源数据");

// 获取源数据

getOrigins();

// 停止分组

Boolean isOver = false;

System.out.println("数据分组处理");

while(!isOver) {

// 数据分组

setGrouped();

// 判断是否停止分组

isOver = isOver();

}

System.out.println("将处理好的数据写入数据库");

// 将分组数据写入新表

write();

System.out.println("写数据完毕");

}

public static void main(String[] args){

List cores = new ArrayList<>();

cores.add(260.0);

cores.add(600.0);

// 表名, 列名, 质心列表

new Kmeans("attributes", "attr_length", cores).run();

}

}

源文件

Kmeans.java

编译

javac Kmeans.java

运行

# 指定依赖库

java -Djava.ext.dirs=./lib Kmeans

if(!cores.get(i).toString().equals(_cores.get(i).toString())){

// 使用新质心

cores = _cores;

return false;

}

}

return true;

}

/**

* 数据分组

*/

private void setGrouped(){

grouped = new HashMap<>();

Double core;

for (Integer origin: origins) {

core = getCore(origin);

if (!grouped.containsKey(core)) {

grouped.put(core, new ArrayList<>());

}

grouhttp://ped.get(core).add(origin);

}

}

/**

* 选择质心

*

* @param num 要分组的数据

* @return 质心

*/

private Double getCore(Integer num){

// 差 列表

List diffs = new ArrayList<>();

// 计算差

for(Double core: cores){

diffs.add(Math.abs(num - core));

}

// 最小差 -> 索引 -> 对应的质心

return cores.get(diffs.indexOf(Collections.min(diffs)));

}

/**

* 建立数据库连接

* @return conhttp://nection

*/

private Connection getConn(){

try {

// URL指向要访问的数据库名mydata

String url = "jdbc:mysql://localhost:3306/data_analysis_dev";

// MySQL配置时的用户名

String user = "root";

// MySQL配置时的密码

String password = "root";

// 加载驱动

Class.forName("com.mysql.jdbc.Driver");

//声明Connection对象

Connection conn = DriverManager.getConnection(url, user, password);

if(conn.isClosed()){

System.out.println("连接数据库失败!");

return null;

}

System.out.println("连接数据库成功!");

return conn;

} catch (Exception e) {

System.out.println("连接数据库失败!");

e.printStackTrace();

}

return null;

}

/**

* 关闭数据库连接

*

* @param conn 连接

*/

private void close(Connection conn){

try {

if(conn != null && !conn.isClosed()) conn.close();

} catch (Exception e){

e.printStackTrace();

}

}

/*VxeGLPgqdr*

* 获取源数据

*/

private void getOrigins(){

Connection conn = null;

try {

conn = getConn();

if(conn == null) return;

Statement statement = conn.createStatement();

ResultSet rs = statement.executeQuery(String.format("select %s from %s", colName, tableName));

while(rs.next()){

origins.add(rs.getInt(1));

}

conn.close();

} catch (Exception e){

e.printStackTrace();

} finally {

close(conn);

}

}

/**

* 向新表中写数据

*/

private void write(){

Connection conn = null;

try {

conn = getConn();

if(conn == null) return;

// 创建表

Statement statement = conn.createStatement();

// 删除旧数据表

statement.execute("DROP TABLE IF EXISTS k_means; ");

// 创建新表

statement.execute("CREATE TABLE IF NOT EXISTS k_means(`core` DECIMAL(11, 7), `col` INTEGER(11));");

// 禁止自动提交

conn.setAutoCommit(false);

PreparedStatement ps = conn.prepareStatement("INSERT INTO k_means VALUES (?, ?)");

for(Map.Entry> entry: grouped.entrySet()){

Double core = entry.getKey();

for(Integer value: entry.getValue()){

ps.setDouble(1, core);

ps.setInt(2, value);

ps.addBatch();

}

}

// 批量执行

ps.executeBatch();

// 提交事务

conn.commit();

// 关闭连接

conn.close();

} catch (Exception e){

e.printStackTrace();

} finally {

close(conn);

}

}

/**

* 处理数据

*/

private void run(){

System.out.println("获取源数据");

// 获取源数据

getOrigins();

// 停止分组

Boolean isOver = false;

System.out.println("数据分组处理");

while(!isOver) {

// 数据分组

setGrouped();

// 判断是否停止分组

isOver = isOver();

}

System.out.println("将处理好的数据写入数据库");

// 将分组数据写入新表

write();

System.out.println("写数据完毕");

}

public static void main(String[] args){

List cores = new ArrayList<>();

cores.add(260.0);

cores.add(600.0);

// 表名, 列名, 质心列表

new Kmeans("attributes", "attr_length", cores).run();

}

}

源文件

Kmeans.java

编译

javac Kmeans.java

运行

# 指定依赖库

java -Djava.ext.dirs=./lib Kmeans


版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:spring boot使用thymeleaf为模板的基本步骤介绍
下一篇:开发者接口(开发者api)
相关文章

 发表评论

暂时没有评论,来抢沙发吧~