尝试创建类KNeighborsClassifier的简单修改时,出现意外结果:
import numpy as np
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.neighbors import KNeighborsClassifier
iris = load_iris()
X_train, X_test, y_train, y_test = train_test_split(iris.data, iris.target, random_state=0)
class my_Classifier(KNeighborsClassifier):
"""My Nearest Neighbour classifier"""
def __init__(self, gamma=0):
def my_dist(x, y): # squared distance
return np.sum((abs(x-y))**gamma)
KNeighborsClassifier.__init__(self, n_neighbors=1, metric=my_dist)
self.gamma = gamma
print(gamma)
def fit(self, X, y):
KNeighborsClassifier.fit(self, X, y)
return self
def predict(self, X, y=None):
return KNeighborsClassifier.predict(self, X)
def score(self, X, y):
return KNeighborsClassifier.score(self, X, y)
我使度量标准取决于参数gamma> = 0。如果gamma = 2,则仅是平方的欧几里德度量;如果gamma = 0,则这是无用的度量(本质上是常数)。首先,它按预期工作:
knn = my_Classifier(gamma=2)
knn.fit(X_train, y_train)
knn.score(X_test,y_test)
输出是
2
0.9736842105263158
(准确性很好),并且
knn = my_Classifier(gamma=0)
knn.fit(X_train, y_train)
knn.score(X_test,y_test)
输出是
0
0.34210526315789475
(准确性是没有希望的)。我也在打印所用伽玛值。
但是,当我尝试
from sklearn.model_selection import GridSearchCV
param_grid = {'gamma': [0,2]}
grid_search = GridSearchCV(my_Classifier(), param_grid)
grid_search.fit(X_train, y_train)
grid_search.score(X_test, y_test)
结果是意外的:
0
0
0
0
0
0
0
0
0.34210526315789475
为什么每次都使用值gamma = 0?从未尝试使用gamma = 2(产生更好的结果)。我知道我犯了一些愚蠢的错误,但是看不到哪里。
python参考方案
每次都不使用值gamma = 0!
得到的结果:
0
0
0
0
0
0
0
0
0.34210526315789475
是score
要查看gamma
,请使用以下命令:
grid_search.cv_results_
Python sqlite3数据库已锁定 - python我在Windows上使用Python 3和sqlite3。我正在开发一个使用数据库存储联系人的小型应用程序。我注意到,如果应用程序被强制关闭(通过错误或通过任务管理器结束),则会收到sqlite3错误(sqlite3.OperationalError:数据库已锁定)。我想这是因为在应用程序关闭之前,我没有正确关闭数据库连接。我已经试过了: connectio…
如何使用sklearn列变压器? - python我正在尝试使用LabelEncoder然后使用OneHotEncoder将分类值(在我的情况下是“国家/地区”列)转换为编码后的值,并且能够转换分类值。但是我收到警告,就像不赞成使用OneHotEncoder'categorical_features'关键字“改为使用ColumnTransformer”。那么我如何使用ColumnTransformer来达到…
Python pytz时区函数返回的时区为9分钟 - python由于某些原因,我无法从以下代码中找出原因:>>> from pytz import timezone >>> timezone('America/Chicago') 我得到:<DstTzInfo 'America/Chicago' LMT-1 day, 18:09:00 STD…
用大写字母拆分字符串,但忽略AAA Python Regex - python我的正则表达式:vendor = "MyNameIsJoe. I'mWorkerInAAAinc." ven = re.split(r'(?<=[a-z])[A-Z]|[A-Z](?=[a-z])', vendor) 以大写字母分割字符串,例如:'我的名字是乔。 I'mWorkerInAAAinc”变成…
如何打印浮点数的全精度[Python] - python我编写了以下函数,其中传递了x,y的值:def check(x, y): print(type(x)) print(type(y)) print(x) print(y) if x == y: print "Yes" 现在当我打电话check(1.00000000000000001, 1.0000000000000002)它正在打印:<…